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天 言 


这 是 一 本 关于 5 语言 的 数组 和 指针 的 书 。 


可 能 有 很 多 和 感到 纳 癌 : “都 什么 年 代 了 ， 还 出 版 6 语言 的 


0 语言 确实 是 非常 陈旧 的 语言 。 去 书店 得 性 就 会 看 到 ，C 语言 的 书 
铺天盖地 ， 其 中 跟 本 书 一 样 专门 讲解 指针 的 书 也 有 很 多 。 同 类 书 一 本 接 
一 本 地 出 版 ， 也 恰好 证 明 5 指针 多 么 难 掌握 。 事 实 上 ， 上 网 一 搜 就 会 
看 到 ，“0C 指针 好 难 啊 ” 的 抱怨 比比 皆 是 。 

那些 为 C 指针 感到 苦恼 的 读者 ， 请 听 我 一 言 : 


理解 不 了 5 指针 不 是 你 的 错 ， 是 C 语言 的 语法 太 坟 人 了 ， 仪 此 
已 ! 

特别 是 C 语言 中 有 关 声 明 的 语法 ， 实 在 是 太 奇 葛 了 。 既 然 是 奇 
蝎 ， 那 就 要 把 它 当 作 奇 厚 来 理解 。 但 是 ， 充 斥 在 书店 里 的 那些 C 语言 
书 ， 即 便 是 专门 讲解 指针 的 ， 也 没有 一 本 正面 指出 过 这 一 点 。 

我 也 曾 对 数组 和 指针 的 相关 语法 感到 非常 纠结 。 

而 我 写本 书 2 的 初 袁 ， 束 是 布 望 和 我 一 样 曾 为 C 指针 感到 苦恼 的 
人 ， 在 阅读 本 书 时 ， 能 够 发 自 内 心地 感慨 : “要 是 那个 时 候 上 天 能 让 我 
遇见 这 样 一 本 书 ， 那 该 多 好 呀 ! ” 


2 这 里 是 指 本 书 第 1 版， 原版 于 2001 年 出 版 ， 中 文 版 由 人 民 邮 电 出 版 社 
于 2013 年 2 月 出 版 。 编者 注 


然而 ， 本 书 第 1 版 是 2001 年 发 行 的 ， 距 今 已 将 近 17 年 3。 虽 








说 5 语言 是 古老 的 《成 熟 的) 语言 ， 变 化 很 慢 ， 但 毕竟 已 经 过 去 17 
年 了 ， 围 绕 5 语言 的 大 环境 多 少 还 是 有 些 变化 的 。2001 年 ， 刚 刚 制定 
不 久 的 150-099 还 没有 完全 替代 原来 的 C 语言 标准 ， 但 如 今 已 经 拥有 
了 相当 数量 的 使 用 者 。2011 年 ， 新 的 标准 C11 也 发 布 了 。 同 时 ， 计 算 
机 也 在 不 断 发 展 ，64 位 操作 系统 已 成 为 主流 。 另 外 ， 随 着 互联 网 的 普 
及 ， 安 全 问题 也 日 益 突 出 。 


3 这 里 是 指 原 书 第 1 版 距 原 书 第 2 版 上 市 (2017 年 12 月) 的 时 间 。 一 一 
编者 注 
针对 这 些 变化 ， 第 2 版 相应 地 对 内 容 进 行 了 修订 。 
目前 市 面 上 的 C6 语言 入 门 书 ， 在 讲解 指针 时 往往 使 用 一 些 非常 教 


科 书 式 的 生硬 例子 来 说 明 。 看 多 了 这 些 例 子 ， 初 学 者 多 半 会 问 : “为 什 
么 非得 要 指针 这 种 东西 呀 ? ” 


然而 ,在 5 语言 编程 中 ， 是 不 可 能 避 开 指针 的 。 实 际 上 ， 现 实 世 
窜 里 所 用 的 程序 也 确实 运用 了 指针 。 


除了 6 语言 〈( 奇 本 的 ) 语法 之 外 ， 本 书 还 会 对 指针 的 实用 方法 进 
行 说 明 。 
在 阅读 本 书 的 过 程 中 ， 请 注意 以 下 几 点 。 


。 本 书 的 读者 定位 虽然 是 “在 学 习 5 语言 的 过 程 中 ， 在 学 到 指 
针 部 分 时 遇 到 了 困难 ”的 人 ， 但 本 书 中 也 不 乏 一 些 高 难度 的 内 容 。 


特别 是 对 于 初学 者 来 说 ， 不 用 非得 从 头 开始 按 顺序 阅读 ， 不 完 
全 弄 清楚 就 个 往 下 继续 。 在 遇 到 不 太 明 日 的 地 方 时 ， 不 要 过 分 纠 
结 ， 先 读 下 去 再 说 。 


在 阅读 时 可 以 跳 过 某 些 章节 ， 但 前 言 和 第 0 章 最 好 按 顺 序 阅 
读 。 要 是 觉得 第 2 草 难 ， 可 以 先 搞 懂 第 3 革 ， 要 是 第 3 章 也 看 
不 懂 ， 那 就 试 着 读 一 下 第 4 章 一 一 这 种 阅读 方式 也 是 可 行 的 。 





在 本 书 中 ， 我 会 经 常 指 出 一 些 “C 的 问题 点 ”和 “C 的 随意 
性 ”。 可 能 会 有 一 些 读者 认为 我 比较 讨厌 Cc 语言 。 


恰恰 相反 ， 我 认为 C 是 一 门 伟大 的 语言 。 倒 不 是 因为 什 
么 “情人 眼 里 出 西施 ”或 者 “傻乎乎 的 孩子 才 可 爱 ”， 而 是 因为 
语言 毕竟 是 在 开发 现场 常年 使 用 的 语言 ， 其 实力 非 同一 般 。 虽 然 长 
得 不 太 帅 ， 但 论 才干 ， 那 绝对 是 “开发 现场 的 老 油 条 ”一 一 这 就 是 
我 对 5 语言 的 看 法 。 


0 是 一 门 实用 的 语言 ， 现 在 依然 值得 学 习 。 虽 然 我 不 希望 看 到 
MS C6 语言 ， 但 谁 讨 大 什么 ， 这 是 我 无 法 左右 
在 本 书写 作 过 程 中 ， 我 得 到 了 很 多 人 的 帮助 。 
感谢 在 百 忙 之 中 阅读 拙 稿 并 给 子 宝贵 意见 的 林 谢 老师 、 曾 田 哲 之 老 
师 、 儿 岛 老 师 、 梵 天 老师 和 丹羽 健 老师 ， 以 及 耐心 等 待 我 修改 原稿 的 技 


术 评论 社 的 熊谷 裕 美 子 老师 ， 承 蒙 诸位 的 帮助 ， 本 书 才 得 以 付 梓 。 在 
此 ， 谨 向 他 们 致 以 深 深 的 谢意 。 


前 桥 和 弥 


2017 年 10 月 29 日 21:58 JS.T. 


‖ 第 0 章 


本 书目 标 与 读者 对 象 


0-1 ”本 书目 标 | 


在 C 语言 的 学 习 中 ， 指 针 被 认为 是 最 大 的 难点 。 
在 学 习 指针 时 ， 我 们 经 常会 听 到 下 面 这 样 的 建议 。 


“只 要 理解 了 计算 机 的 内 存 和 地 址 的 概念 ， 指 针 什么 的 就 不 在 话 


下 了 
“因为 5 是 低级 语言 ， 所 以 先 学 习 汇编 语言 比较 好 。 





的 确 ， 在 理解 C 指针 时 ， 如 果 事 先 对 内 存 和 地 址 的 概念 有 所 了 
解 ， 就 会 快 很 多 至 于 是 否 需 要 学 习 汇 编 语言 ， 我 表示 怀疑 》。 但 是 ， 
仅 懂得 内 存 和 地 址 的 概念 ， 是 无 法 掌握 指针 的 。 理 解 内 存 和 地 址 的 概 
0 
征 ” 的 第 一 步 。 


网 观察 一 下 初学 者 实际 使 用 C 指针 的 过 程 ， 就 会 发 现 很 多 下 面 这 样 
9 问题。 


。 用 int *a; 声明 指针 变量 …… 到 这 里 还 挺 像样 的 ， 可 是 在 将 这 个 
指针 变量 当 作 指针 使 用 时 ， 依 然 翡 剧 地 写成 了 *a。 

。 写 出 了 int &a; 这 样 的 声明 〈 全 拜托， 这 又 不 是 C++) 。 

。 什 么 是 “指向 int 的 指针 ”? 指针 不 就 是 地 址 吗 ? 怎么 还 有 “ 指 


向 int 的 指针 ”“ 指 向 char 的 指针 ”， 难 道 它 们 还 有 什么 不 同 
吗 ? 73 


。 当 学 习 到 “给 指针 加 1， 指 针 会 前 进 `2 个 字 节 或 4 个 字 
节 ” 时 ， 可 能 会 有 这 样 的 疑问 : “指针 不 就 是 地 址 吗 ? 在 这 种 情况 
下 ， 难道 指针 不 应 该 是 前 进 1 个 字 贡 吗 ? ” 


”这 里 所 谓 的 “前 进 ”， 严 格 来 说 是 指 指针 向 高 地 址 方向 移动 。 一 一 译 者 注 





。 “对 于 scanf()， 在 使 用 %d 的 情况 下 ， 需 要 在 变量 前 加 上 
& 才能 传递 参数 。 可 是 ， 为 什么 在 使 用 %s 时 就 可 以 不 加 & 
呢 ? 9 


。 当 学 习 到 将 数组 名 赋 给 指针 时 ， 将 数组 和 指针 混为一谈 ， 犯 下 “把 
未 分 配 内 存 空间 的 指针 当 作 数 组 访问 ”或 者 “试图 把 指针 赋 给 数组 
名 ”这 样 的 错误 。 


出 现 以 上 混乱 情形 ， 并 不 是 因为 没有 理解 “指针 就 是 地 址 ”， 真 正 
的 原因 是 : 


。C 语言 奇 驴 的 声明 语法 
数组 与 指针 之 间 微 妙 的 兼容 性 


看 到 我 说 5 语言 的 声明 语法 奇 范 ， 估 计 有 些 读者 会 不 明 所 以 。 那 
么 ， 大 家 是 否 有 过 如 下 疑问 呢 ? 


在 (C 语言 的 声明 中 ， [] 的 优先 级 比 * 高 ， 所 以 char *s[108]; 

这 样 的 声明 表示 “指向 char 的 指针 的 数组 ”一 一 弄 反 了 吧 ? 

。 搞 不 明白 double (*p)[3]; 和 void (*func)(int a); 这 样 
的 声明 到 底 应 该 怎样 阅读 。 

。int *a; 表示 把 a 声明 为 “指向 int 的 指针 ”， 但 表达 式 中 的 

ei 明明 是 一 样 的 符号 ， 为 蛤 意思 却 相 
> 

int *a 和 int a[] 在 什么 情况 下 可 以 互 换 ? 
空 的 [] 可 以 在 什么 地 方 使 用 ， 代 表 的 又 是 什么 意思 ? 


本 书 就 是 为 了 对 这 样 的 疑问 给 出 解答 而 编写 的 。 


下 我 也 是 在 使 用 5 语言 好 几 年 之 后 ， 才 真正 明白 声明 的 
JH7AHY。 


我 不 愿意 承认 自己 技 不 如 人 ， 所 以 总 是 认为 实际 上 只 有 极 少 的 人 能 
够 精通 C 语言 中 的 声明 。 上 毕竟 ， 我 自己 在 掌握 5 语言 声明 之 前 ， 已 经 
勤 勤 夸 居 地 码 了 好 几 年 代码 了 。 即 便 是 自 认 为 “5 语言 很 简单 嘛 ， 指 针 
我 也 已 经 完全 掌握 了 ”的 各 位 看 官 ， 其 实 也 可 能 只 是 知 其 一 不 知 其 二 。 


例如 ， 你 知道 下 面 这 些 事实 吗 ? 


。 在 引用 数组 中 的 元 素 时 ，a[i] 中 的 [] 其 实 跟 数 组 没 半 点 关系 。 
。0C 语言 中 不 存在 多 维 数组 。 


如 果 你 在 书店 看 到 这 本 书 ， 翻 看 几 页 后 心 想 “什么 呀 ? 简直 是 奇谈 
怪 论 ! ”而 默默 地 又 把 书 放 回 书架 了 ， 那 么 你 恰恰 需要 阅读 本 书 。 


因为 5 语言 是 模仿 汇编 语言 的 低级 语言 ， 所 以 要 想 理解 指针 ， 就 
必须 理解 内 存 和 地 址 的 概念 一 一 当 听 到 这 种 说 法 时 ， 你 可 能 会 认为 : 指 
针 是 C 语言 所 特有 的、 底层 而 政 恶 的 功能 。 


事实 并 非 如 此 。5 指针 的 确 有 其 底层 而 邪恶 的 一 面 ， 但 一 般 来 说 ， 
旧 针 也 是 构造 链表 、 树 形 结构 等 数据 结构 所 不 可 或 缺 的 概念 。 如 果 没 有 
它 ， 就 没 法 写 出 像样 的 应 用 程序 。 因 此 ， 只 要 是 成 熟 的 编程 语言 ， 就 毫 
无 疑问 地 存在 指针 。Pascal 、Java、C#、Lisp、Ruby 和 Python 都 是 
如 此 。 虽 然 Java 在 一 开始 的 时 候 宣 称 “Java 没有 指针 ”， 不 过 那 只 
是 以 论 传 率 而 已 ， 如 今 已 经 没什么 人 相信 这 种 话 了 。 


本 书 也 会 涉及 指针 的 真正 用 法 一 一 构造 数据 结构 。 
指针 是 成 熟 的 编程 语言 中 必 不 可 少 的 一 个 概念 。 


那么 ， 为 什么 5 语言 的 指针 格外 地 星 涩 难 懂 呢 ? 这 是 拜 C 语言 混 
乱 的 声明 语法 ， 以 及 指针 和 数组 之 间 微 妙 的 兼容 性 所 赐 。 


本 书 将 前 明 5 语言 混乱 的 语法 ， 先 讲解 C 语言 特有 的 指针 用 法 ， 
然后 讨论 5 语言 和 其 他 语言 通用 的 普遍 的 指针 用 法 。 





0-2 读者 对 象 与 内 容 结构 


本 书 的 读者 对 象 为 : 
。 粗略 地 读 过 5 语言 的 入 门 书 ， 但 对 指针 还 是 不 太 理解 的 人 。 
。 C0 语言 运用 自如 ， 但 实际 上 对 指针 理解 得 还 不 够 透彻 
的 人 。 
本 书 并 非 C 语言 的 入 门 书 ， 所 以 关于 编译 方法 、if 语句 等 就 个 进 
行 说 明了 。 很 抱歉 ， 有 这 方面 学 习 需 求 的 朋友 请 自行 购买 其 他 书 。 
本 书 的 内 容 结 构 如 下 所 示 。 


第 1 章 : 打 好 基础 一 一 预备 知识 和 复习 

第 2 章 : 做 个 实验 一 一 C 语言 是 怎样 使 用 内 存 的 
第 3 章 : 语法 揭秘 一 一 它 到 底 是 怎么 回 事 

第 4 章 : 数组 和 指针 的 常见 用 法 

第 5 章 : 数据 结构 一 一 指针 的 真正 用 法 

第 6 章 : 其 他 一 一 拾遗 


第 1 章 和 第 2 章 主要 面向 初学 者 ， 从 “指针 就 是 地 址 ”这 个 观点 
开始 讲解 。 


地 址 是 一 个 通过 printf() 即 可 亲自 确认 其 实际 值 的 概念 ， 非 常 
具体 且 容 易 理 解 。 通 过 在 自己 的 机 器 上 实际 输出 指针 的 值 ， 可 以 相对 简 
单 地 领悟 指针 的 概念 。 


首先 ， 第 1 章 会 对 C 语言 的 发 展 过 程 〈C 是 怎样 “沦落 ”到 现在 
这 种 样子 的 ) 、 指 针 以 及 数组 进行 说 明 。 


初学 者 一 定 会 感到 纳 问 : 为 什么 非 用 指针 这 个 东西 不 可 呢 ? 有 些 入 
门 书 甚至 将 a[i] 这 样 已 经 用 数组 写 好 的 程序 ， 特 地 重 写 成 *p++ 这 
样 的 指针 运算 形式 ， 还 说 什么 “这 才 是 5 语言 的 风格 ”。 


和 语言 的 风格 ? 或 许 的 确 可 以 这 么 说 ， 但 是 以 此 为 由 炮制 出 来 的 


难 懂 的 写法 ， 到 底 好 在 哪里 ?什么 ?执行 效率 高 ? 这 是 真 的 吗 ? 





产生 这 些 疑 问 是 正常 的 ， 甚 至 可 以 说 ， 这 么 想 束 对 了 。 


一 些 老 的 5 语言 书 (特别 是 1-1 节 提 到 的 语言 “ 圣 
经 ”K&R*) 多 以 使 用 指针 运算 的 程序 作为 例题 进行 讲解 ， 但 实际 上 ， 如 
今 看 来 非常 地 聊 涩 难 懂 。 而 了 解 了 C 语言 的 发 展 过 程 ， 就 能 理解 6 语 
言 为 什么 会 有 指针 运算 这 样 奇怪 的 功能 。 


”K&R 指 的 是 《C 程序 设计 语言 》 一 书 。 一 一 编者 注 








除 此 之 外 ， 我 们 还 会 讲 到 初学 者 前 进 路 上 的 绊脚石 
的 那些 容易 让 人 混淆 的 语法 。 


第 2 章 将 介绍 5 语言 实际 上 是 怎样 使 用 内 存 的 。 


这 里 同样 采用 直观 的 方式 将 地 址 输出 。 请 有 5 语言 运行 环境 的 读 
者 务必 实际 输入 示例 程序 ， 并 尝试 运行 。 


对 于 普通 的 局 部 变量 、 函 数 的 参数 、static 变量 、 全 局 变量 和 字 
符 串 字面 量 “用 "" 引 住 的 字符 串 ) 等 ， 了 解 了 它们 在 内 存 中 是 如 何 保 
存 的 ， 就 可 以 理解 C 语言 的 各 种 行为 。 

遗憾 的 是 ， 大 部 分 5 语言 程序 甚至 可 以 说 完全 没有 执行 运行 时 检 
查 。 如 果 在 写 入 时 发 生 数组 越 弄 ， 立 刻 就 会 引发 内 存 损坏 。 虽 然 这 类 
Bug 很 难 避 免 ， 但 知道 了 5 语言 怎样 使 用 内 存 之 后 ， 至 少 可 以 在 一 定 
程度 上 推断 出 这 类 Bug 的 原因 。 

第 3 章 将 介绍 与 数组 和 指针 相关 的 5 语言 语法 。 


0 语言 到 底 为 什么 总 被 人 抱怨 “指针 很 难 ” 了 呢 ? 我 们 已 经 多 次 提 到 


数组 和 指针 


过 ，“ 指 针 就 是 地 址 ”这 个 说 法 其 实 挺 容易 理解 的 ， 之 所 以 说 指针 难 ， 
主要 是 因为 C 语言 中 数组 和 指针 的 语法 太 过 混乱 。 


和 语言 的 语法 乍 一 看 比较 严谨， 实际 上 却 存在 很 多 例外 情形 。 


那些 我 们 常用 的 语法 究竟 是 遵循 什么 规则 运用 的 ? 哪些 语法 需要 特 
殊 对 待 ? 对 于 这 些 问题 ， 第 3 章 中 将 给 出 明确 的 回答 。 


那些 自 认 为 是 5 语言 老手 的 读者 ， 请 信 我 一 次 ， 务 必 读 一 读 第 3 


媳 


第 4 章 是 实践 篇 ， 将 举例 说 明 数 组 和 指针 的 常见 用 法 。 理 解 了 这 
部 分 内 容 ， 对 付 大 多 数 程序 应 该 不 成 问题 。 


对 于 第 4 章 所 举 的 例子 ， 经 常 使 用 C 语言 的 读者 可 能 会 很 熟悉 。 
但 是 ， 即 便 是 平时 都 在 使 用 这 里 介绍 的 写法 的 读者 ， 对 语法 的 理解 也 并 
We 或 者 大 多 数 情况 下 只 是 照 着 以 前 见 过 的 代码 “ 依 戎 六 画 
跌 ”罢了 。 


读 完 第 3 章 再 读 第 4 章 的 话 ， 对 于 那些 用 惯 了 的 写法 ， 你 会 发 
现 : “ 哦 ， 原 来 是 这 个 意思 啊 ! ” 


另外 ， 初 学 者 就 能 够 理解 “指向 指针 的 指针 ” (也 有 人 称 之 为 双 指 
针 ) 等 并 不 是 什么 高 深 莫 测 的 东西 ， 只 是 单纯 地 将 指针 的 用 法 组 合 起 来 
第 5 章 将 介绍 指针 真正 的 用 法 一 一 数据 结构 的 基础 。 


到 第 4 章 为止 所 举 的 例子 基本 上 都 是 C 语言 所 特有 的 ， 而 第 5 
章 会 涉及 其 他 语言 里 也 有 的 指针 的 话题 。 


无 论 使 用 什么 语言 ， 数 据 结 构 都 是 重 中 之 重 。 在 用 5 语言 构造 数 
据 结构 时 ， 结 构 体 和 指针 起 到 了 至 关 重 要 的 作用 。 


如 果 读 者 在 学 习 5 语言 时 不 仅 党 得 指针 难 懂 ， 连 结构 体 也 搞 不 太 


R= 3 : 木 \ 主 M3 NE so NA __ 
清楚 ， 请 务必 阅读 这 早 。 


第 6 章 将 对 前 几 章 未 履 盖 到 的 知识 点 进行 补充 说 明 ， 列 举 一 些 陷 
阱 以 及 惯用 语法 。 


本 书 与 其 他 同类 书 相 比 ， 相 当 注 重 语法 细节 。 


说 到 语法 ， 不 知 为 何 总 给 人 一 种 “就 算 不 知道 也 没 哈 问题 ”的 印 
， 就 像 人 们 经 常 批 判 日 本 的 英语 教学 过 于 注重 语法 一 样 。 的 确 ， 我 们 
早 在 学 会 日 语 的 动词 变形 之 前 就 已 经 会 说 日 语 了 嘛 。 


但 是 ，5 语言 并 非 日 语 这 样 复 杂 的 自然 语言 ， 而 是 一 门 编程 语言 。 


要 按照 语法 来 解释 自然 语言 是 很 困难 的 。 比 如 ， 在 你 申请 客户 办 公 
室 的 访客 证 时 ， 输 入 的 是 “fangkezheng”， 却 被 输入 法 识别 为 “房客 
证 ”。 编 程 语言 只 不 过 是 用 人 类 想 出 来 的 语法 进行 编写 ， 并 由 所 谓 编 译 
器 的 程序 进行 解释 而 已 。 


“大 家 都 这 么 写 ， 那 我 这 么 写 应 该 也 能 跑 起 来 吧 ! ” 





这 种 想法 真 让 人 感到 些许 悲哀 呢 。 

我 希望 不 只 是 初学 者 ， 有 一 定 经 验 的 程序 员 也 务必 阅读 一 下 本 书 。 
在 深入 理解 了 5 语言 的 语法 之 后 ， 对 于 那些 迄今 为 止 一 直 使 用 的 惯用 
写法 ， 想 必 就 能 够 释然 接受 了 吧 。 


反正 都 是 要 用 的 ， 那 就 做 到 “ 知 其 然 知 其 所 以 然 ” 吧 。 这 样 才 有 蔡 
于 身心 健康 嘛 。 


关于 本 书 的 支持 页 面 


本 书 的 支持 页 面 如 下 所 示 ， 书 中 所 用 的 源 代码 可 以 从 图 灵 社 区 本 
主页 1 下 载 。 


对 于 本 书 提供 的 源 代码 ， 无 论 是 否 用 于 商用 用 途 ， 都 可 以 自由 地 


复制 、 修 改 、 重 新 发 布 。 但 是 ， 为 了 防止 混乱 ， 请 在 重新 发 布 时 注 明 
是 修改 版 。 





本 书 中 出 现 的 产品 名 称 等 一 般 为 各 公司 的 注册 商标 或 商标 。 


正文 中 未 使 用 "和 8 等 对 其 予以 明确 标记 。 


e。 本 书 仅 以 提供 信息 为 目的 。 请 读者 基于 自己 的 判断 使 用 本 
书 。 对 于 执行 本 书 示例 程序 导致 的 损失 等 ， 出 版 社 及 作 译 者 概 不 
负责 ， 敬 请 知悉 。 





1 请 至 “ 随 书 下 载 ” 处 下 载 本 书 源 代码 。 男 外 ， 关 于 与 本 书 内 容 有 关 的 
链接 ， 请 点 击 页 面 下 方 的 “相关 文章 ”查看 。 一 一 编者 注 














| 第 1 章 
打 好 基础 一 一 预备 知识 和 复习 


1-1-1 C0 语言 的 发 展 历程 
众所周知 ，C 语言 原本 是 为 了 开发 UNIX 操作 系统 而 设计 的 语 


互 


* 在 如 今 ， Linux 比 UNIX 更 有 名 。Linux 是 由 林 纳 斯 托 瓦 兹 《Linus B. 


Torvalds) 重 写 的 类 UNIX 操作 系统 。 





如 此 说 来 ， 似 乎 C 语言 应 该 比 UNIX 更 早 问 世 ， 但 实际 上 并 非 如 
此 。 最 早期 的 UNIX 并 不 是 用 5 语言 开发 的 ， 而 是 用 汇编 语言 开发 
的 。 

汇编 语言 几乎 可 以 说 是 与 机 器 语言 一 一 对 应 的 语言 。 例 如 ， 对 于 从 
1 加 到 100 的 程序 ，C 语言 代码 如 代码 清单 1-1 所 示 ， 而 汇编 语言 代 
码 则 如 代码 清单 1-2 所 示 。 


代码 清单 1-1 assembly.c 


int i; 
int sum = ©; 
for (i = 1; i <= 1060; i++) { 


Sum += i; 


} 


代码 清单 1-2 assembly. s 节选 自 以 C 语 言 代 码 为 基础 ， 在 
x86-64 的 Linux 环境 里 通过 gcc 的 -s 选项 输出 的 代码 ) 


mov1 $6，-4(%rbp)  “《-- 将 6 赋 给 代表 变量 sum 的 内 存 空间 的 -4(%rbp) 
mov1 $1，-8(%rbp)  “《-- 将 1 赋 给 代表 变量 i 的 内 存 空间 的 -8(%rbp) 
jmp .L2 <-- 跳 转 到 标签 L2 处 





mov1 -8(%rbp)，%eax <-- 将 变量 i 的 值 赋 给 寄存 器 eax 
addl %eax，-4(%rbp) <-- 将 寄存 器 eax 的 值 加 上 变量 sum 
add1l $1，-8(%rbp) <-- 变 量 i 加 1 














cmpl $166，-8(%rbp) <-- 比 较 变 量 i 和 166 
jle .L3 <-- 当 比较 结果 为 i<168 时 ， 跳 转 到 标签 L3 处 


在 汇编 语言 代码 的 旁边 有 简单 的 说 明 ， 不 过 现在 没 必要 去 理解 它 。 
看 过 代码 清单 1-2 之 后 ， 就 个 难 想象 要 用 汇编 语言 写 大 型 程序 会 多 么 
地 不 容易 。 更 何况 ， 汇 编 语言 还 因 CPU 而 异 ， 不 具备 可 移植 性 。 


UNIX 之 父 肯 : 汤普森 (Ken Thompson) 考虑 到 不 能 再 使 用 汇编 语 
言 来 开发 UNIX 了 ， 因 而 开发 了 一 种 称 为 B 的 语言 。B 语言 是 剑桥 大 
学 的 马丁 : 理 查 兹 (Martin Richards) 于 1967 年 开发 的 
BCPL (Basic CPL) 的 精简 版 。BCPL 的 前 身 是 1963 年 剑桥 大 学 与 伦敦 
大 学 共同 研究 开发 的 CPL (Comb ined Programming Language， 组 合 编 
和 王 旨 二 。 








B 语言 不 直接 生成 机 器 码 ， 而 是 先 由 编译 器 生成 供 栈 式 机 使 用 的 中 
间 代 码 ， 然 后 由 解释 器 来 运行 《类 似 于 Java 或 者 UCSD Pascal) 。 
此 ，B 语言 的 运行 十 分 耗 时 ， 最 终 人 们 放弃 了 在 UNIX 中 使 用 它 。 


1971 年 ， 肯 … 汤普森 的 同事 丹尼斯 : 里 奇 (Dennis Ritchie) 对 


B 语言 进行 了 改良 ， 增 加 了 char 数据 类 型 ， 并 且 使 之 能 够 直接 输出 
PDP-11 的 机 器 码 。B 语言 曾 在 很 短 的 一 段 时 间 内 被 称 为 NB (New 
B) 。 


后 来 ，NB 被 改称 为 (一 一 ( 语言 诞生 了 。 


当时 大 家 都 用 汇编 语言 来 编写 操作 系统 这 样 的 程序 ， 早 期 的 UNIX 
也 是 用 汇编 语言 编写 的 ， 但 如 上 所 述 ， 对 于 汇编 语言 ， 不 论 是 编写 还 是 
维护 ， 抑 或 是 移植 ， 都 非常 困难 。 因 而 ，1973 年 肯 : 汤普森 用 5 语言 
几乎 重 与 了 整个 UNIX。 


总 的 来 说 ，C 语言 是 一 线 开发 人 员 为 满足 自己 的 使 用 需求 而 创造 出 
来 的 语言 。 之 后 5 语言 也 主要 是 迎合 使 用 UNIX 的 程序 员 的 需求 ， 一 
边 接 受 各 方 的 意见 建议 ， 一 边 顺 其 自然 地 不 断 扩展 着 各 种 功能 。 


然后 ，C 语言 迎 来 爆炸 式 的 普及 ， 除 了 操作 系统 ， 还 广泛 应 用 于 应 
用 程序 的 开发 。 不 过 ， 和 希望 大 家 牢记 ，5 语言 一 开始 只 是 汇编 器 的 替 
代 品 《至今 还 有 人 挪 担 其 为 “结构 化 的 汇编 妖 ”) 。 


补充 是 汇编 语言 还 是 汇编 器 


上 文中 同时 出 现 了 “汇编 语言 ”和 “汇编 器 ”两 个 词 ， 这 并 非 是 
作者 和 编辑 粗心 大 意 。 


众所周知 ， 计 算 机 (CPU〉 只 能 执行 机 器 语言 。 而 因为 机 器 语言 
只 是 单纯 地 罗列 数字 ， 所 以 人 类 是 很 难 读 写 的 "。 在 用 机 器 语言 写 程 
序 时 ， 实 际 上 是 先 编写 跟 机 器 语言 一 一 对 应 的 汇编 语言 代码 ， 然 后 手 
工 改写 成 机 器 语言 〈 称 为 手工 汇编 ) ， 或 者 由 被 称 为 汇编 器 的 程序 改 
瑟 成 机 器 语言 。 也 就 是 说 ， 把 汇编 语言 重 瑟 成 机 器 语言 这 项 工作 称 为 


汇编 ， 而 自动 实现 该 功能 的 程序 叫 作 汇编 器 。 作 为 一 种 习惯 ，“ 用 汇 
编 语 言 写 程序 ”就 意味 着 “用 汇编 器 来 写 ”， 所 以 也 可 以 说 成 是 “用 
汇编 器 写 程序 ”。 


”不 过 以 前 也 经 常会 有 “大 神 ” 手 工读 写 机 器 码 。 





对 于 汇编 前 的 语言 ， 现 在 通常 称 为 “汇编 语言 ”， 有 时 也 可 以 称 
为 “汇编 器 语言 ”。 从 前 ，J1S 将 它 规定 为 “汇编 器 语言 ”， 如 今 在 
言 息 处 理工 程 师 考试 的 大 纲 里 依然 保留 着 “汇编 器 语言 ”的 称呼 
(2016 年 10 月 的 版 本 ) 。 因 此 ， 这 两 个 词 可 以 认为 是 同一 个 意思 。 


* JIS 是 Japanese Industrial Standards (日 本 工业 标准 ) 的 简称 。 一 一 译 者 注 


补充 B 语言 是 什么 样 的 语言 


C 语言 的 入 门 书 中 经 常会 提 到 ，C 语言 是 B 语言 的 进化 版 ， 但 
几乎 所 有 的 书 对 B 语言 的 介绍 就 仅 此 而 已 ， 并 没有 具体 说 明 B 语言 


究竟 是 一 门 什么 样 的 语言 。 


如 前 所 述 ，B 语言 是 在 虚拟 机 上 运行 的 解释 型 语言 ， 但 它 并 没有 
像 Java 那样 追求 “到 处 运行 ” (Run anywhere) 的 崇高 目标 ， 而 是 
因为 受到 最 初 运行 UNIX 环境 的 PDP-7 的 硬件 限制 ， 只 能 使 用 解释 
器 这 样 的 实现 万 式 。 


B 语言 是 “没有 类 型 ”的 语言 。 现 在 一 提 到 没有 类 型 的 语言 ， 人 
们 就 会 想到 JavaScript、Python、Ruby 等 “变量 没有 数据 类 型 ， 什 
么 类 型 的 值 都 能 进行 赋值 ”的 语言 ， 但 B 语言 并 不 是 这 样 的 ， 它 只 
能 使 用 word 类 型 〈 即 依赖 于 硬件 种 类 来 确定 位 数 的 整数 类 型 。 在 
PDP-11 上 是 16 位 ) 。 对 于 本 书 的 主题 旧 针 ， 在 B 语言 中 也 是 
和 整数 一 样 处 理 的 。 指 针 ， 简 而 言 之 就 是 内 存 中 的 地 址 ， 因 而 在 有 的 
机 器 中 也 可 以 当 作 整数 类 型 来 处 理 〈( 关 于 这 一 点 ， 本 章 会 详细 介 


绍 ) 。 


关于 B 语言 的 语法 ， 可 以 参考 论文 “User's Reference to 
B”。 看 到 该 论文 中 的 示例 程序 ， 你 就 会 发 现 B 语言 中 已 经 出 现 了 像 
adx = &x1 和 x = *adx++ 这 类 在 现今 的 C 语言 里 也 能 看 到 的 写 





法 。 


作为 B 语言 的 进化 版 ，NB 是 具有 数据 类 型 的 语言 。 为 了 把 指针 
和 整数 竟 为 一 谈 的 B 移植 到 NB， 丹 尼斯 * 里 奇 在 指针 的 处 理 上 下 了 
很 大 功夫 。C 语言 的 指针 变 得 如 此 纷繁 复杂 ， 可 能 也 有 这 方面 的 原 
因 。 





1-1-2 不 完备 和 不 统一 的 语法 


0 语言 是 开发 现场 的 人 们 根据 自己 的 需求 创造 出 来 的 ， 所 以 具备 极 
强 的 实用 性 。 但 从 人 类 工程 学 的 角度 来 看 ， 它 就 个 是 那么 完美 了 。 


比如 ， 相 信 大 家 都 犯 过 下 面 这 样 的 错误 。 





if (a = 5) {<-- 把 本 该 写成 == 的 地 方 写成 了 = 


在 日 语 键盘 上 ，“-” 和 “=” 是 同一 个 按键 ， 因 此 经 常会 发 生 下 面 
的 问题 。 


for (i - 6; i < 166; i++) { <-- 忘记 同时 按 下 Shift 键 





即便 是 这 种 情况 ， 编 译 器 也 往往 并 不 报错 。 现 在 的 编译 器 可 能 会 给 
出 警告 ， 但 是 早期 的 编译 器 对 这 样 的 错误 是 全 部 无 视 的 。 


使 用 switch case 时 忘记 写 break 也 是 易 犯 的 错误 。 


笠 运 的 是 ， 对 于 吻 犯 的 语法 错误 ， 现 在 的 编译 器 已 经 可 以 在 很 多 地 
万 给 出 警告 了 。 因 此 ， 无 视 编译 器 的 警告 是 不 行 的 。 我 们 应 该 尽 可 能 提 
高 编译 怖 的 警告 级 别 ， 使 编译 怖 能 够 指出 尽 可 能 多 的 错误 。 


换 句 话说 ， 在 编译 器 给 出 错误 和 警告 时 ， 不 要 抱怨 : “ 净 给 我 找事 
儿 ， 这 个 混蛋 ! ”而 是 应 该 心怀 感激 地 说 一 声 : “谢谢 您 了 ， 编 译 器 先 
生 。 ”然后 认真 地 把 Bug 修改 掉 。 


尽 可 能 调 高 编译 器 的 警告 级 别 。 


不 可 以 无 视 或 者 阻止 编译 器 的 警告。 





1=1=3 请 襄 译作 ”一 一 KR 


被 称 为 C 语言 “圣经 ”的 The C Programming Languagetj 第 1 
版 发 行 于 1978 年 。 


人 们 将 布 莱 恩 : 柯 林 汉 (Brian Kernighan) 和 丹尼斯 . 里 硼 
(Dennis Ritchie) 两 位 作者 的 英文 名 首 字母 合 起 来 ， 称 该 书 为 K&R。 
在 后 面 提 到 的 ANS1 标准 制定 之 前 ， 该 书 一 直 被 作为 C 语言 语法 的 参 
考 基准 使 用 。 


据说 在 最 初 发 行 该 书 时 ， 出 版 方 ， 即 英国 培 生 出 版 社 曾 预 估 在 当时 
的 130 个 UNIX 站 点 里 ， 平 均 每 个 站 点 可 以 卖 出 9 本 〈 摘 自 Life 
with UNIXL21) 。 


结果 ， 仅 K&R 第 1 版 的 销量 就 比 培 生出 版 社 最 初 的 预计 多 出 了 3 
位 数 ”"。 原 本 只 是 为 了 满足 自己 的 需求 而 开发 的 C 语言 ， 历 经 坎坷 ， 最 
终 成 为 全 世 罕 广泛 使 用 的 开发 语言 。 


* 根据 亚马逊 上 的 本 书 试 读 章节 ， 截 至 2008 年 9 月 20 日 ，K&R 第 2 版 仅 日 文 版 


就 已 经 印刷 321 次 了 ! 这 个 行业 的 图 书 能 有 这 样 的 业绩 ， 确 实 称 得 上 现象 级 畅销 书 。 





之 后 ， 在 1989 年 ， 也 就 是 ANS1 C 正式 发 布 前 不 久 ，K&R 第 2 
版 问世 ， 并 成 了 ANS1 C 的 依据 。 


在 ANSI1 C 尚未 出 现 之 时 ，K&R 是 事实 上 的 5 语言 标准 ， 因 此 也 
有 人 将 ANS1 5 之 前 的 旧式 C6 语言 称 为 “K&R C”。 不 过 考虑 到 目前 在 


售 的 K&R 是 ANS1 5 的 依据 ， 这 种 叫 法 容易 遭 人 误解 。 因 此 ， 在 本 书 
中 ， 在 提 到 ANSI 5C 之 前 的 C6 语言 时 ， 我 们 还 是 尊重 事实 ， 称 之 
为 “ANS1 C6 之 前 的 C6 语言 ”。 


另外 ， 本 书 在 下 文 提 到 K&R 时 ， 指 的 是 日 文 版 的 第 2 版 。 


”中 文 版 请 参考 《C 程序 设计 语言 (第 2 版 ) 》。 一 一 译 者 注 





K&R 多 年 以 来 都 被 奉 为 C 语言 “圣经 ”。 的 确 ， 书 中 附录 A 和 附 
录 B 精心 整理 了 6 语言 的 规范 和 标准 库 ， 使 用 起 来 十 分 便利 ， 但 可 能 
由 于 该 书 的 定位 是 入 门 书 ， 所 以 正文 部 分 写 得 不 够 严谨 ， 其 中 有 些 表述 
容易 遭 人 误解 或 不 够 准确 。 特 别 是 例题 中 的 示例 程序 ， 以 目前 的 眼光 来 
看 ， 我 觉得 相当 不 合适 。 


话 虽 如 此 ， 作 为 一 名 C6 程序 员 ， 就 算是 为 了 了 解 C 语言 的 历史 ， 
也 应 该 买 一 本 放 在 书架 上 。 但 要 是 打算 靠 这 一 本 书 来 理解 C 语言 ， 即 
便 说 不 上 和 鲁莽， 对 大 多 数 人 来 说 也 是 低 效 的 。 更 何况 ， 这 本 书 也 不 支持 
后 面 我 们 要 讲 的 那些 新 标准 (C95、C99 和 C11) 。 


1-1-4 ANSI1 C 之 前 的 C0 语言 

ANS1 C 标准 制定 于 1989 年 ， 其 实 已 经 非常 陈旧 了 。 或 许 有 人 会 
觉得 ， 比 这 还 要 陈旧 的 5 语言 知识 ， 学 了 可 能 也 没什么 用 。 实 际 上 我 
也 这 么 觉得 ， 但 老式 的 5 语言 规范 对 现在 的 5 语言 也 是 有 一 定 影响 
的 ， 所 以 我 们 还 是 耐 着 性 子 看 一 下 吧 。 

在 ANSI1 C 制定 之 前 ，C 语言 一 直 在 不 断 扩展 。 


比如 关于 结构 体 的 整体 赋值 ， 虽 然 K&R 第 1 版 里 并 没有 介绍 ， 但 
其 实在 K&R 出 版 之 前 ， 这 个 功能 就 已 经 在 丹尼斯 * 里 奇 的 5 编译 器 里 
实现 了 。 从 某 种 意义 讲 ，K&R 第 1 版 刚 出 版 就 已 经 过 时 了 。 不 过 ， 这 
在 计算 机 图 书 界 是 常 有 的 事 。 


在 ANS1 C 里 ， 变 化 比较 大 的 是 函数 定义 的 语法 和 原型 的 声明 。 


在 ANSI C 制定 之 后 ， 函 数 定义 是 下 面 这 样 的 。 


void func(int a, double b) 
{ 


} 





而 在 ANS1 C 之 前 的 0 语言 中 则 是 下 面 这 样 : 


void func(a, b) 
int a; 
double b; 


{ 
} 





个 对 


说 起 来 ， 关 于 Ce 语言 Re {} 的 位 置 ， 有 人 是 像 下 面 这 样 ， 
了 是 K&R 里 面 的 书写 风格 ， 所 以 这 里 称 之 
“K&R 的 55 


if (a == 6) { 
可 是 在 函数 定义 的 时 候 ， 他 们 又 把 { 与 在 了 代码 行 的 开头 ， 这 让 


人 很 是 困惑 "。 其 实 这 是 ANS1 C 之 前 的 C i 题 (也 因 
为 有 些 工具 以 代码 行 开 头 的 花 括 号 作为 判断 函数 起 始 的 依据 ) 。 


”毕竟 ，Java 等 语言 的 方法 定义 也 是 把 { 写 在 右边 的 。 





此 外 ， 老 式 的 5 语言 里 没有 函数 的 原型 声明 。 如 果 在 ANS1 C 里 
写 出 如 下 原型 声明 ， 那 么 在 调用 该 函数 时 ， 当 参数 的 个 数 或 类 型 发 生 错 
误 时 ， 编 译 器 会 报错 。 


void func(int a, double b); 


但 是 ， 因 为 老式 6 语言 里 没有 这 个 功能 ， 所 以 正确 指定 参数 的 责 


任 就 落 在 了 程序 员 身 上 。 如 今 看 来 ， 这 是 一 个 非常 危险 的 规则 ， 但 说 到 
底 ， 那 时 候 的 6 语言 只 是 汇编 器 的 替代 品 ， 所 以 没 人 觉得 不 受 。 


然而 ， 对 于 有 返回 值 的 函数 ， 假 如 不 明确 其 返回 值 的 类 型 ， 编 译 器 
就 无 法 生成 接收 返回 值 的 那 部 分 的 机 器 码 。 因 此 ， 比 如 对 于 三 角子 数 
sin(), 就 需要 像 下 面 这 样 ， 仅 声明 返回 值 的 类 型 。 


”如 果 不 声 明 ， 该 函数 就 会 作为 整体 被 当 作 返回 int 的 函数 处 理 。 

















double sin(); 














在 现代 的 C 语言 里 ， 在 声明 没有 参数 的 函数 原型 时 ， 必 须 像 下 面 
这 样 在 括号 里 写 上 void。 


void func(void); 


这 是 为 了 与 老式 5 语言 的 函数 声明 兼容 〈 为 了 区 别 到 底 是 由 于 使 
用 老式 声明 而 不 进行 参数 检查 ， 还 是 在 明确 指出 该 函数 不 接收 参数 ) 


* 


O 


”C++ 放弃 了 兼容 老式 06， 所 以 不 需要 这 个 void。 





1-1-5 ANSI C (C89/90) 


如 前 所 述 ，K&R 第 1 版 里 并 没有 记载 在 它 出 版 后 才 实现 的 功能 ， 
和 
而 有 所 差异 。 


鉴于 这 些 情况 ， 经 过 一 番 争 论 ， 终 于 在 1989 年 ， 美 国 国家 标准 学 
会 (American National Standards lnstitute，ANS1) 通过 了 C 语言 
的 标准 规范 。 


顾名思义 ， 美 国 国家 标准 学 会 是 美国 的 标准 。ANS1 C 后 来 被 国际 
标准 化 组 织 (lnternational 0rganization for Standardization， 
1S0) 采用 ， 成 为 标准 1S0/1EC 9899:1990*。 由 于 ANS1 0 发 布 于 
1989 年 ， 而 1S0 的 标准 发 布 于 1990 年 ， 所 以 这 个 版 本 的 C 有 时 被 
称 为 C89， 有 时 被 称 为 090。 看 上 去 有 些 混乱 ， 其 实 内 容 都 一 样 。 


* 相应 的 中 国 国家 标准 为 GB/T 15272-1994。 一 一 译 者 注 





由 于 089 和 090 的 称呼 容易 与 后 面 将 介绍 的 095 和 099 混淆 ， 
所 以 本 书 将 该 版 本 的 C 叫 作 ANS1 C0”。 


* 事实 上 ，085、099 和 C011 都 是 经 过 ANS1 认可 的 标准 ， 但 通常 在 提 到 ANS1 C 


时 ， 指 的 是 C89 和 C90， 所 以 本 书 也 仿 而 效 之 。 





随后 ，1S0AIEC 9899:1990 被 日 本 的 JIS 标准 采用 ， 成 为 J1S 
X3010:1993。 


1-1-6 C95 
1SO/IEC 9899:1990 于 1995 年 增加 了 处 理 宽 字符 的 库 ， 成 为 


1S0/1EC 9899/AMD1:1995。 所 谓 AMD1， 是 指 Ammendment1， 其 中 的 
Ammendment 是 “标准 的 修正 ”的 意思 。 


这 次 修订 增加 了 可 以 处 理 宽 字符 、 实 现 宽 字 符 和 多 字符 的 转换 
的 函数 集 。 
在 C 语言 中 ， 字 符 串 基本 上 就 是 char 的 数组 ， 而 char 类 型 的 


长 度 为 1 个 字 节 (通常 是 8 位 ) 。 对 美国 人 来 说 ， 这 就 已 经 能 够 满足 
使 用 需求 了 ， 但 因为 我 们 使 用 汉字 等 多 种 字符 ， 所 以 无 法 用 1 个 字符 
对 应 1 个 字 贡 来 表示 。 


我 们 多 使 用 GB2312、GBK 或 UTF-8 这 些 字符 编码 ， 用 多 个 字 节 构 
造 中 文 的 字符 串 。 例 如 “"abc 一 二 三 四 五 "” 这 个 字符 串 ， 如 果 用 
GB2312 表示 ， 那 么 “abc” 的 部 分 是 1 个 字符 对 应 1 个 字 节 ， 而 “一 
二 三 四 五 ”的 部 分 是 1 个 字符 对 应 2 个 字 节 ， 这 种 表示 方法 就 是 多 字 
节 字 符 串 。 但 是 在 使 用 这 种 方法 的 情况 下 ， 每 个 字符 的 长 度 都 是 可 变 
的 ， 因 此 在 以 字符 为 单位 分 割 字符 串 时 会 很 麻烦 。 例 如 我 们 要 制作 一 款 
文字 编辑 器 这 样 的 程序 ， 那 么 在 前 后 移动 光标 时 ， 就 无 法 立刻 辨别 表示 
字符 位 置 的 变量 到 底 是 要 移动 1 个 字 节 ， 还 是 要 前 进 2 个 字 节 。 


因此 ， 宽 字符 适时 登场 。 如 果 使 用 宽 字 符 ， 就 可 以 用 固定 长 度 的 
wchar_t 类 型 来 定义 单个 字符 。wchar_t 类 型 早 在 制定 ANS1 C 时 就 
已 经 被 定义 过 了 ， 但 实际 使 用 它 的 输入 输出 函数 以 及 转换 函数 在 
1SOZ1IEC 9899/AMD1:1995 中 才 被 定义 。 


c95 并 非 主流 称呼 ， 而 且 后 来 的 C99 里 也 包含 了 这 里 增加 的 函 
数 ， 所 以 无 须 区 别 对 待 1S0/1EC 9899/AMD1:1995。 只 不 过 对 于 我 们 来 
说 ， 不 可 避免 地 要 处 理 汉 字 字 符 ， 所 以 这 里 简单 介绍 了 一 下 。 


长 久 以 来 ，“C 的 字符 串 就 是 char 的 数组 ”算是 一 个 常识 ， 但 现 
在 这 一 常识 已 经 被 打破 了 。 不 过 ， 考 虑 到 大 部 分 读者 是 初学 者 ， 所 以 本 
书 总 体 上 还 将 基于 “C 的 字符 串 就 是 char 的 数组 ”来 讲解 。 


1-1-7 099 


099 是 1999 年 12 月 1 日 由 150 制定 的 6 语言 标准 ， 其 正式 
名 称 为 1S0/ 1EC 9899:1999。 


在 标准 制定 之 前 ，099 的 代号 为 C9x。 之 所 以 起 这 个 代号 ， 是 因为 
当初 预计 该 标准 可 以 在 20 世纪 90 年 代 中 期 确定 。 可 是 ， 最 终 决 策 直 
到 1999 年 12 月 才 完成 ， 真 是 一 直 争 论 到 了 最 后 一 刻 。 不 过 到 底 是 没 
白 争 论 这 么 久 ，099 最 终 增加 了 许多 功能 ， 如 下 所 示 。 


以 // 开头 的 单行 注释 (C++ 从 前 就 有 这 个 写法 ) 

变量 也 可 以 不 在 代码 块 的 开头 声明 (这 也 是 C++ 从 前 就 有 的 功 
能 

预 处 理 器 的 功能 扩展 、 可 变 长 参数 等 

增加 了 复数 类 型 、_Bool 类 型 


。 对 类 型 定义 更 加 严格 。 废 除了 如 1-1-4 刷 的 注释 里 所 说 
的 “没有 声明 的 函数 就 返回 int” 等 规则 ” 


K&R 开头 的 程序 “hello，wor1d.” 并 没有 在 main() 中 指定 返回 值 的 类 


* 
型 ， 这 是 违反 C99 的 语法 的 。 





。 指定 初始 化 器 (6-3-11 节 ) 
。 复合 字面 量 〈(6-3-12 节 ) 
e。 可 变 长 数组 (Variable Length Array，VLA) 
。 邓 性 数组 成 员 
本 书 是 关于 数组 和 指针 的 ， 所 以 将 重点 讲解 最 后 两 项 ， 即 可 变 长 数 


组 和 和 柔性 数组 成 员 。 不 过 ， 由 于 并 不 是 所 有 读者 都 使 用 099 的 运行 环 
境 ， 所 以 对 于 099 特有 的 功能 ， 我 们 会 在 编程 时 明确 指出 。 


C99 也 为 JIS 标准 所 采用 ， 其 标准 号 为 JIS X3010:2003。 从 日 本 
标准 协会 的 网 页 上 可 以 购买 其 纸 质 版 或 PDF 版 。 


在 本 书 中 ， 当 “标准 ”一 词 单独 出 现时 ， 特 指 JIS X3010:2003， 
因为 其 标准 文档 是 目前 最 容易 获取 的 。 


另外， 虽然 该 标准 文档 的 PDF 版 可 以 从 网 页 下 载 ， 但 为 了 防止 不 
法 之 徒 通过 廉价 出 售 大 量 复制 的 文件 牟利， 文档 的 每 一 页 上 都 会 能 入 购 
买 者 的 姓名 。 说 句 题 外 话 ， 个 人 希望 除了 JIS 的 标准 文档 ， 电 子 书 也 
sn 以 满足 读者 在 其 他 终端 上 阅读 或 备份 的 需 


1-1-8 C11 


C11 是 2011 年 12 月 8 日 制定 的 6 语言 标准 ， 其 正式 名 称 为 
1S0/1EC 9899:2011， 这 是 截至 2017 年 的 最 新 版 本 *。 


* 现行 的 C 语言 标准 是 1S0/1EC 9899:2018， 发 布 于 2018 年 7 月 。 一 一 编者 注 





C11 里 增加 了 多 线程 支持 、Unicode 支持 以 及 无 名 联合 体 等 功能 ， 
不 过 这 些 功 能 和 本 书 的 主题 一 一 数组 和 指针 关系 不 大 。 关 于 库 函 数 的 部 
分 内 容 ， 我 们 将 在 6-1 市 讲解 。 


Cc11 的 标准 文档 目前 还 未 经 JIS 处 理 ， 因 而 只 有 英文 版 。 我 们 可 
以 从 1S0 的 Web 站 点 购买 PDF 版 ， 草 案 可 以 从 开放 标准 网 下 载 。 


1-1-9 C 语言 的 理念 


ANS1 0 标准 附 有 一 份 Rationale 〈 理 论 依据 ) 文件 资料 (但 它 并 
非 该 标准 的 一 部 分 )“。 





”对 于 以 下 引用 部 分 ，099 版 与 当初 的 ANS1 5 是 一 样 的 。 





其 中 提 到 了 “Keep the spirit of CGC”【 保 持 C 的 精神 ) ， 关 
于 “0C 的 精神 ”是 这 样 介绍 的 : 


。 相信 程序 员 (Trust the programmer. ) 

。 不 要 阻止 程序 员 做 应 该 做 的 (Don't prevent the programmer 
from doing what needs to be done. ) 

。 保持 语言 的 小 巧 和 简单 (Keep the language smal| and 
simple. ) 

。 对 每 种 操作 仅 提 供 一 种 方法 (Provide only one way to do an 
operation. ) 


。 即 使 损失 可 移植 性 ， 也 要 追求 运行 效率 (Make it fast，even if 


it is not guaranteed to be portable.) 


开头 两 点 最 重要 一 一 好 吧 ， 这 么 胡 周 的 事情 还 真能 说 出 口 。 


0 是 危险 的 语言 。 一 着 不 慎 全 盘 皆 输 的 陷阱 随处 可 见 。 


尤其 是 ， 可 以 说 几乎 所 有 的 5 语言 实现 都 没有 进行 运行 时 检查 。 
例如 ， 在 向 超出 数组 范围 的 地 址 执行 写 入 操作 时 ， 现 在 大 部 分 语言 可 以 
当场 报错 ， 但 C 语言 的 大 部 分 运行 环境 却 是 默默 地 执行 写 入 操作 ， 最 
终 导 致 无 关 区 域 的 内 存 数据 遭 到 破坏 。 


C 语言 是 基于 程序 员 无 所 不 能 的 理念 设计 出 来 的 。 在 设计 5 语言 
时 ， 优 先 考 虑 的 是 : 


人 
-出 4 王 

。 如何 才能 写 出 能 够 生成 高 效率 的 执行 代码 的 程序 〈 而 不 是 优化 编译 
器 ， 使 之 生成 高 效率 的 执行 代码 ) 


而 安全 性 的 问题 被 完全 忽略 了 。 不 管 怎 么 说 ，C 语言 原本 就 只 是 
UNIX 的 开发 者 为 了 满足 自己 的 使 用 需求 而 开发 出 来 的 。 


幸运 的 是 ， 如 今 的 操作 系统 可 以 在 程序 明显 出 现 问 题 时 立刻 终止 程 
序 运行 。UNIX 会 报 出 “上 段 错 误 ” (segmentation fault) 或 “总 线 错 
误 ” (bus error) 这 类 错误 提示 ， 而 Windows 则 会 弹出 “xx. exe 已 
停止 工作 ”这 样 的 消息 。 


。 同样， 这 时 也 不 能 抱怨 “ 净 给 我 找事 儿 ， 这 个 混蛋 ! ”而 应 该 心怀 
感激 地 说 一 声 :， “谢谢 您 了 ， 操 作 系统 先生 ! ”然后 认真 地 去 调试 。 


话 虽 如 此 ， 靠 操作 系统 来 终止 程序 ， 说 到 搬 是 沾 了 运气 好 的 光 。 在 
程序 明显 是 要 访问 奇怪 的 内 存 位 置 时 ， 操 作 系统 多 半 会 替 我 们 终止 程序 
的 运行 。 但 麻烦 的 是 那 种 在 只 越 弄 几 个 字符 的 位 置 进行 写 入 的 情况 。 要 
追踪 这 类 Bug 非常 困难 ， 因 为 这 些 错 误 的 症状 很 少 会 马上 显现 。 


第 2 章 将 说 明 5 语言 具体 是 怎样 使 用 内 存 的 。 理 解 了 这 一 点 ， 对 
解决 此 类 Bug 多 少 会 有 些 帮 助 。 


要 扣 


操作 系统 帮助 我 们 终止 程序 ， 这 是 运气 好 的 情况 。 





麻烦 的 是 操作 系统 无 法 终止 的 “一 点 点 的 ”内 存 空间 损坏 。 





1-1-10 C 语言 的 主体 
这 里 先 出 个 题目 考 考 大 家 。 
请 从 下 面 的 单词 中 ， 选 出 5 语言 规定 的 关键 字 〈 保 留 字 ) 。 


if printf main malloc sizeof 





正确 答案 是 if 和 sizeof。 


“printf 和 malloc 不 必 多 说 ， 连 main 也 不 是 5 语言 的 关键 
字 吗 ? 9 


有 这 样 想 法 的 读者 ， 请 拿 起 手头 的 书 查 一 查 。 相 信 大 部 分 5 语言 
入 门 书 会 给 出 6 语言 的 关键 字 列 表 。 


C 语言 之 前 的 许多 语言 把 输入 输出 作为 语言 自身 功能 的 一 部 分 。 比 
如 Pascal 是 用 write() 这 样 的 标准 过 程 ”来 实现 相当 于 5 语言 的 
printf() 功能 的 。Pascal 的 语法 规则 对 它 有 特殊 处 理 *。 


* Pascal 中 有 函数 (function) 和 过 程 (procedure) 两 种 概念 ，write() 属于 标准 
过 程 。 译 者 注 


* 根据 JIS X3008 中 6.6.4.1 的 备注 内 容 ，“ 标 准 过 程 及 标准 函数 不 一 定 遵从 过 程 
和 函数 的 一 般 规 则 ”。 





与 此 相对 ，C 语言 将 printf() 这 样 的 输入 输出 功能 从 语言 主体 
剥离 ， 使 之 成 为 单纯 的 库 函 数 。 对 于 编译 器 来 说 ，printf() 函数 和 一 


般 程序 员 所 写 的 函数 并 无 差异 *。 


”现在 也 有 可 以 帮 我 们 检查 printf() 的 参数 的 编译 器 。 





在 程序 员 看 来 ， 输 入 输出 只 需 调用 一 下 printf() 即 可 实现 ， 但 
其 实 青 后 的 处 理 相当 复杂 ， 需要 向 操作 系统 提出 各 种 各 样 的 请 求 等 。C 
语言 并 没有 把 这 类 复杂 处 理 归 拢 在 语言 主体 里 ， 而 是 全 都 放 到 了 库 里 。 


很 多 编译 型 语言 会 将 被 称 为 “运行 时 例 程 ” 《run-time routine) 
的 机 瑚 码 “悄悄 地 ” 藤 入 编译 〈 链 接 ) 后 的 程序 中 。 输 入 输出 这 样 的 功 
能 就 包含 在 运行 时 例 程 里 。 但 6 语言 里 几乎 没有 必须 要 “悄悄 地 ” 藤 
入 运行 时 例 程 的 复杂 功能 “。 由 于 稍微 复杂 一 点 的 功能 全 都 被 封装 到 了 

库 里 ， 所 以 程序 员 只 需 显 式 地 调用 函数 。 


”当初 在 PDP-11 的 运行 环境 上 ， 似 乎 是 悄悄 地 幅 入 了 32 位 的 乘除 运算 ， 以 及 处 理 


函数 入 口 和 出 口 的 运行 时 例 程 。 





这 既是 C 语言 的 和 
程序 开发 和 学 习 才 变 得 


1-1-11 0C | 只 月 能 使 用 标量 的 语言 

对 于 标量 (scalar) 这 个 词 ， 大 家 可 能 有 些 阳 生 。 

简单 地 说 ， 标 量 指 的 就 是 char、int、double、 枚 举 型 等 算术 类 
型 以 及 指针 。 相 对 地 ， 像 数组 、 结 构 体 和 联合 体 这 样 由 多 个 标量 组 合 而 
成 的 类 型 ， 我 们 称 为 聚合 类 型 (aggregate) 。 

早期 的 C 语言 能 够 一 起 处 理 的 只 有 标量 。 

我 经 常 听 到 初学 者 有 以 下 疑问 。 


也 是 和 正 因为 这 个 优点 ，5C 语言 
7 些 


if (str == "abc") 


写 了 这 样 的 代码 ， 但 是 无 法 运行 。 我 确实 已 经 把 abc 赋 给 str 
了 ， 但 是 条 件 表达 式 就 是 无 法 判 为 真 。 为 什么 呢 ? 





对 于 这 个 疑问 ， 可 以 给 出 这 样 的 回答 : “这 个 表达 式 并 没有 进行 字 
只 是 比较 了 指针 。” 除 此 之 外 ， 我 们 也 可 以 换 一 个 角度 来 
说 明 : 


char 类 型 的 数组 ， 也 就 是 说 它 不 是 标量 ， 


一 下 子 对 数组 里 的 所 有 元 素 进行 比较 。 





说 到 早期 的 C 语言 能 够 一 起 实现 的 功能 ， 那 就 只 有 将 标量 这 
种 “小 巧 的 ”类 型 从 右边 放 到 左边 〈 赋 值 ) ， 或 者 标量 之 间 的 运算 、 标 
量 之 间 的 比较 等 。 


C 就 是 这 样 一 门 语言 ， 输 入 输出 自 不 必 说 ， 就 连 数 组 和 结构 体 ，C 
也 放弃 了 通过 语言 自身 的 功能 进行 整合 利用 。 


但 是 ， 得 蔓 于 以 下 几 个 功能 ，ANS1 5 中 能 够 整合 利用 聚合 类 型 
TT 


结构 体 的 整体 赋值 

将 结构 体 作 为 函数 参数 传递 
将 结构 体 作为 函数 返回 值 返回 
auto 变量 的 初始 化 


这 些 当 然 都 是 非常 便利 的 功能 ， 虽 然 如 今 这 些 功能 都 可 以 积极 地 使 
用 了 不如 说 是 应 该 使 用 ) ， 但 在 早期 的 5 语言 里 ， 根 本 没有 这 些 功 
能 。 在 理解 C 语言 的 基本 原则 时 ， 以 早期 的 5 语言 为 基准 来 理解 也 不 
是 什么 坏事 。 


特别 要 指出 来 的 是 ， 别 说 ANS1 C 了 ， 即 便 是 099 和 011， 也 还 
个 能 做 到 对 数组 进行 整合 利用 。 将 数组 赋值 给 另外 一 个 数组 ， 或 者 将 数 
组 作为 参数 传递 给 其 他 函数 等 做 法 在 5 语言 中 是 不 存在 的 。 


但 是 ， 因 为 结构 体 是 可 以 被 整合 利用 的 但 不 能 进行 比较 ) ， 所 以 
在 实际 的 编程 中 ， 应 该 积极 地 使 用 其 可 用 的 功能 ”。 


” 话 虽 如 此 ， 在 将 结构 体 当 作 参 数 传递 时 ， 如 果 结 构 体 的 长 度 太 长 ， 在 运行 效率 上 可 


能 会 出 现 问 题 。 


1-2 ”内 存 和 地 址 | 


第 0 章 里 提 到 : 





的 确 ， 在 理解 C 指针 时 ， 如 果 事 先 对 内 存 和 地 址 的 概念 有 所 了 
解 ， 束 会 快 很 多 《至 于 是 否 需要 学 习 汇 编 语 言 ， 我 表示 怀疑 ) 。 但 
是 ， 仅 懂得 内 存 和 地 址 的 概念 ， 是 无 法 掌握 指针 的 。 理 解 内 存 和 地 


址 的 概念 可 能 是 理解 指针 的 必要 条 件 ， 但 并 不 是 充分 条 件 。 这 只 
是 “万 里 长 征 ”的 第 一 步 。 





ee 念 是 理解 指针 的 必要 条 件 ， 那 么 下 面 就 来 了 解 
= 下 它 人 |s 


1-2-1 内存 和 地 址 


现在 的 计算 机 主要 将 动态 随机 存 取 存储 器 (Dynamic Random 
Access Memory，DRAM) 用 作 主 存储 器 。DRAM 又 称 为 “动态 RAM”， 它 
可 以 根据 一 种 非常 小 的 电容 的 充电 情况 (充电 或 未 充电 ) ”来 表示 数据 


是 0 还 是 1。 


”由 于 电容 太 小 ， 因 而 电能 过 一 段 时 间 就 会 释放 殖 尽 ， 所 以 需要 定期 重 写 〈 刷 新 ) ， 


动态 RAM 就 是 由 此 得 名 的 。 





因为 可 以 用 1 位 表示 数据 是 0 还 是 1， 所 以 如 果 使 用 2 进 制 
数 ， 就 可 以 用 8 位 表示 0 ”255 的 数值 。 平 时 我 们 使 用 的 10 进 制 数 
的 1 位 由 0 ”9 表示 ,着 10 进位 ,而 2 进 制 数 的 1 位 由 0 ”1 
表示 ， 才 2 进位 。 但 是 ，2 进 制 数 的 位 数 太 长 ， 难 以 处 理 ， 所 以 人 们 
也 经 常 使 用 另 一 种 方便 阅读 的 表示 方法 ， 即 16 进 制 数 。 通 过 对 2 进 
制 数 每 4 位 读 取 1 次 ， 可 以 将 其 转换 成 16 进 制 数 。 由 于 16 进 制 数 
的 1 位 需要 由 0 ”15 来 表示 ， 为 避免 与 10 进 制 数字 混淆 ， 所 以 需 
要 使 用 字母 A“”F ( 表 1-1) 。 


表 1-1 10 进 制 数 、2 进 制 数 和 16 进 制 数 











现在 大 部 分 计算 机 是 以 8 位 为 一 个 单位 处 理 数据 的 ， 我 们 称 之 为 
字 节 (byte) 。 将 多 个 可 表示 1 字 节 的 内 存 排列 起 来 ， 就 可 以 表示 与 
所 排列 的 字 节 数 相对 应 的 信息 。 比 如 某 计 算 机 的 内 存 为 16 GB， 这 里 的 
16 GB 就 是 指 16 000 000 000 (160 亿 ) 个 * 可 表示 1 字 节 的 内 存 的 
排列 一 一 如 此 大 容量 的 内 存 只 要 1 万 多 日 元 就 能 买 到 ， 我 们 真是 赶 上 
了 一 个 了 不 起 的 时 代 。 


* 由 于 1 GB = 1024 MB，1 MB = 1024 KB， 所 以 准确 来 说 这 里 应 该 是 17 179 869 


184 字 节 。 





为 了 对 内 存 进 行 读 写 ， 必 须 指 定 要 访问 的 是 庞大 的 内 存 空 间 里 的 哪 
个 位 置 ， 这 时 使 用 的 就 是 地 址 〈address) 。 现 在 仅 考虑 以 下 情况 : 内 
存 中 的 每 个 字 节 都 有 一 个 地 址 ， 地 址 编号 从 0 开始 顺序 递增 ” (图 1- 
pe 


”实际 上 ， 这 种 地 址 是 物理 地 址 ， 与 现代 计算 机 中 程序 员 一 般 使 用 的 地 址 (虚拟 地 


址 ) 是 不 同 的 。 关 于 虚拟 地 址 ， 请 参考 2-1 节 。 





以 8 位 ( 1 字 节 ) 为 单位 











1 字 节 占用 内 存 
的 一 个 地 址 











图 1-1 内存 和 地 址 


虽然 1 字 节 (8 位 ) 只 能 表示 0 ”255 的 数 ， 但 只 要 增加 1 
位 ， 可 表示 的 数 就 会 倍增 ， 所 以 可 以 将 多 个 字 节 组 合 起 来 ， 比 如 使 用 2 
字 节 〈16 位 ) 表示 0 ”6%5 535 的 数 ， 使 用 4 字 节 (32 位 ) 表示 0 
”4 294 967 295 的 数 。 


由 于 地 址 也 是 由 2 进 制 数组 成 的 ， 所 以 32 位 计算 机 (32 位 的 操 
作 系 统 的 计算 机 大 多 如 此 ) 只 有 4 GB 的 寻 址 能 “32 位 计算 机 不 
支持 4 GB 以 上 的 内 存 ” 说 的 就 是 这 个 意思 。 近年 来 64 位 计算 机 (64 
位 的 CPU 和 操 作 系 统 的 计算 机 ) 0 其 寻 址 空间 可 达 244 字 
节 ， 即 约 1680 万 太 字 节 (TB) ” 


” 话 虽 如 此 ， 实 际 上 为 了 节省 电路 ，64 位 的 计算 机 上 无 法 配置 那么 多 的 内 存 。 从 现实 


情况 来 看 ， 也 没有 那个 必要 。 





1-2-2 ”内 存 和 变量 
0 程序 里 使 用 的 变量 值 是 保存 在 内 存 中 的 。 


也 就 是 说 ， 各 个 变量 都 被 分 配 了 芭 个 地 址 的 内 存 。 向 变量 赋值 ， 惑 
是 把 ]} 值 保存 在 这 个 地 址 的 内 存 中 。 


在 C 语言 中 ， 单 是 保存 整数 的 变量 就 有 诸如 char 类 型 、short 
类 型 、int 类 型 和 long 0 种 类 型 。 不 同类 型 的 变量 各 自 有 不 
同 的 取 值 范围 。 这 是 因为 ， 变 量 在 内 存 里 所 占 的 字 节 数 因数 据 类 型 不 同 
而 不 同 。 


如 前 所 述 ， 比 如 int 类 型 是 4 字 节 (32 位) ， 如 果 只 表示 正 数 
(在 unsigned int 的 情况 下 ) ， 则 可 以 表示 0“ 4 294 967 295 的 
数 ; 如果 也 要 表示 负数 ， 比 如 使 用 “2 的 补 码 表示 ”一 一 把 ffffffff 
作为 -1，fffffffe 作为 - 2， 将 一 半 用 于 负数 ， 那 么 32 位 可 以 表 
示 -2 147 483 648 ”2 147 483 647 的 数 。 


double 类 型 和 float 类 型 这 样 的 浮 点 型 是 以 不 同 于 整数 的 方式 
保存 在 内 存 中 的 。 现 在 的 运行 环境 使 用 的 大 多 是 符合 1EEE 754 标准 的 


0 语 吾 言 并 不 强制 遵守 该 标准 ， 但 Java 和 C# 的 语 言 规范 里 规 定 必须 遵守 该 标准 。 





关于 各 种 数据 类 型 分 别 占 多 少 个 字 节 ， 可 以 通过 sizeof 运算 符 
确认 【代码 清单 1-3) 。 


代码 清单 1-3 sizeof.c 


#include <stdio.h> 


int main(void) 





printf(" Bool..%d\n",，(int)sizeof( _ Bool)); // C99 以 后 支持 
printf("char..%d\n", (int)sizeof(char)); 
printf("short..%d\n", (int)sizeof(short)); 
printf("int..%d\n", (int)sizeof(int)); 
printf("long..%d\n", (int)sizeof(long)); 

printf("long long ..%d\n", (int)sizeof(long long)); // C99 以 后 支持 
printf("float ..%d\n", (int)sizeof(float)); 

printf("double ..%d\n", (int)sizeof(double)); 











在 我 的 计算 机 运行 环境 中 ， 结 果 如 下 所 示 。 


_Bool..1 
char..1 
short..2 
int..4 
long..8 

long long ..8 
float ..4 
double ..8 





但 是 ， 关 于 各 种 数据 类 型 分 别 占 多 少 字 节 ，C 语言 的 标准 并 没有 严 
格 规定 。 不 过 ，C 语言 规定 了 对 char 和 unsigned char 执行 
sizeof 的 结果 为 1。 另 外 ， 对 于 各 个 整数 类 型 ，5C 语言 的 标准 规定 了 
至 少 要 能 表示 多 少数 〈 表 1-2) 。 


表 1-2 标准 规定 的 整数 类 型 的 取 值 范围 





标准 规定 的 范围 


signed char — |27~127 


一 9 223 372 030 854 775 807~9 223 372 030 
854 775 807 


long long (C99 以 后 支持 ) 


unsigned long long (C99 以 后 


0~18 446 744 073 709 551 615 
支持 ) 





首先 ， 前 面 提 到 32 位 可 以 表示 -2 147 483 648 “2 147 483 
647 的 数 ， 然 而 表 1-2 里 long 的 下 限 却 是 -2 147 483 647。 这 是 为 
了 顾及 那些 在 表示 负数 时 没有 利用 广泛 应 用 的 “2 的 补 码 表示 ”， 而 是 
使 用 了 “1 的 补 码 表示 ”的 运行 环境 〈 这 里 读者 不 理解 也 没有 关系 ) 。 


另外 ， 关 于 int 可 以 表示 的 整数 范围 ， 标 准 只 保证 了 其 上 限 略 大 
于 3 万 ， 可 能 你 会 觉得， 无论 怎 么 说 这 都 太 少 了 。 更 何况 ， 在 实际 运 
行 的 5 语言 程序 中 ， 肯 定 有 很 多 程序 需要 使 用 远大 于 它 的 数 对 int 赋 
值 。 当 然 ， 如 果 把 这 些 程序 放 到 符合 标准 的 其 他 运行 环境 下 执行 ， 确 实 
有 可 能 跑 不 起 来 。 因 为 它们 并 不 是 严格 遵守 标准 的 程序 (strictly 
conforming program) 。 但 现实 问题 是 ， 哪 怕 是 能 在 如 今 的 计算 机 上 运 


行 的 程序 ， 如 果 将 其 放 到 int 为 2 字 节 的 运行 环境 ”中 ， 也 还 是 会 发 
a (比如 内 存 不 足 ) ， 所 以 不 管 多 在 意 标准 规定 的 范围 也 
无 济 于 事 。 


”0( 语言 也 经 常 被 用 在 家 电 等 的 幅 入 式 程序 上 ， 因 此 int 为 2 字 节 的 运行 环境 也 是 


存在 的 。 





在 C6 语言 中 ， 用 来 保存 变量 的 内 存 上 的 空间 叫 作 对 象 
(object) ， 而 被 保存 为 对 象 的 数据 类 型 〈 比 如 int、double) 叫 作 
对 象 类 型 (ob ject type) *。 


”数组 和 指针 也 是 对 象 类 型 ， 具 体 请 参考 3-2-6 节 。 


补充 size t 类 型 

在 代码 清单 1-3 中 ， 由 运算 符 sizeof 获取 的 各 类 型 的 长 度 是 
在 转换 成 int 之 后 显示 的 。 

这 是 因为 ， 运 算 符 sizeof 的 返回 值 是 size_t 类 型 ， 而 
printf() 的 %d 所 能 显示 的 是 int 类 型 。 在 我 的 运行 环境 
下 ，size t 类 型 被 typedef 定义 为 long unsigned int 类 型 
了 。 


对 32 位 操作 系统 来 说 ， 由 于 在 大 多 数 运行 环境 里 int 类 型 和 
long 类 型 是 32 位 ， 所 以 在 这 种 情况 下 即使 用 %d 显示 size_t 类 
型 ， 基 本 上 也 没 问题 ”， 但 如 今 64 位 操作 系统 也 很 常用 ， 而 且 int 
和 “size_t 的 长 度 大 多 是 不 同 的 ， 因 此 如 果 束 这 么 直接 使 用 %d， 则 
无 法 显示 数据 类 型 的 长 度 。 


| 





从 099 开始 ，printf() 的 输出 格式 里 增加 了 %zd， 使 用 它 就 
可 以 正确 显示 sizeof 的 结果 。 不 过 ， 鉴 于 并 非 所 有 读者 都 使 用 
C099 的 运行 环境 ， 所 以 本 书 中 依然 会 保留 类 型 转换 的 处 理 。 





1-2-3 ”内 存 和 程序 运行 


大 家 用 C 语言 所 写 的 代码 ， 在 编译 后 生成 的 机 器 码 程 序 〈 可 执行 


文件 ，executable file) 可 能 一 度 是 保存 在 硬盘 ”上 的 ， 但 到 了 要 执 
行 的 时 候 ， 就 会 被 放 到 内 存 里 


最 近 比 较 常 用 的 或 许 是 SSD (Solid State Drive， 液 态 硬盘 ) 。 





然后 ，CPU 一 边 读 取保 存在 内 存 里 的 机 器 码 程 序 ， 一 边 按 顺 序 执 


由 于 程序 是 按 顺 序 执行 的 ， 所 以 就 需要 有 能 够 表示 现在 正在 执行 的 
是 哪个 地 址 的 机 器 码 命令 的 计数 器 ， 我 们 称 之 为 程序 计数 器 (program 
counter) 。 em 然后 指向 下 一 
个 命令 ， 但 在 有 条 件 分 支 或 者 循环 时 ， 它 会 突然 增加 以 跳 过 某 些 命令 ， 
或 者 突然 减 小 以 回 到 之 前 的 位 置 。 


在 程序 引用 变量 值 ， 或 者 把 值 保存 到 变量 中 时 ，CPU 会 对 保存 变量 
的 地 址 所 指向 的 内 存 进行 读 写 ”。 


”在 如 今 的 计算 机 中 ， 在 CPU 和 主 存储 器 之 间 还 存在 多 段 缓存 (cache) 。 缓 存 的 访 


问 速 度 很 快 ， 但 因为 比较 昂贵 ， 所 以 容量 很 小 ， 这 里 不 再 详细 说 明 。 





男 外 ，CPU 内 部 有 一 种 被 称 为 寄存 器 〈register) 的 部 件 ， 类 似 于 
机 器 语言 中 的 变量 。CPU 对 寄存 器 的 访问 速度 比 对 主 存储 器 的 访问 速度 
快 得 多 ， 但 寄存 器 数量 很 少 ， 所 以 通常 用 来 保存 访问 频率 极 高 的 变量 ， 
或 者 计算 过 程 中 的 临时 数据 。 其 中 ， 访 问 频率 极 高 的 变量 是 通过 编译 器 
的 优化 自动 分 配给 寄存 器 的 。 有 些 寄存 器 具有 特殊 意义 ， 例 如 前 面 提 到 
的 程序 计数 器 也 是 一 个 寄存 器 。 


本 节 内 容 的 总 结 如 图 1-2 所 示 。 


CPU 按 顺序 执行 程序 计数 器 所 指向 的 命令 
< 和 程序 
程序 计数 器 
数据 一 
也 会 访问 内 存 里 的 数据 ， CPU 内 部 有 被 称 为 寄存 器 
这 要 视 程序 内 容 而 定 的 非常 高 速 的 内 存 


图 1-2 程序 的 执行 
关于 内 存 和 地 址 ， 我 们 已 经 在 接近 机 器 语言 的 层面 进行 了 说 明 。 


如 果 是 现今 的 高 级 程序 语言 ， 可 能 无 须 在 意 这 些 内 容 。 但 在 理解 5 
语言 时 ， 这 种 “低级 ”” 的 知识 很 有 必要 。 











”这 里 的 “低级 ”可 不 是 在 贬低 5 语言 ， 而 是 一 个 表示 “接近 于 硬件 ”这 个 意思 的 技 


术 用 语 





1-3 ”关于 指针 


1-3-1 恶名 昭著 的 指针 究竟 是 什么 
关于 指针 ，K&R 中 有 如 下 说 明 〈 见 该 书 第 5 章 章 首 ) 。 


指针 是 一 种 保存 变量 地 址 的 变量 。 在 5 语言 中 ， 指 针 的 使 用 非 
泛 。 


常 广 





1-2 市 已 经 对 地 址 进行 了 说 明 ， 相 信 对 于 “变量 地 址 ”， 大 家 已 经 
不 再 陌生 了 。 


下 面 ， 我 必须 吹 毛 求 狂 地 指出 ， 从 表达 上 来 说 ，K&R 的 这 段 说 明 是 
有 很 大 问题 的 ， 这 会 让 人 感觉 指针 就 是 “变量 ”， 但 实际 上 并 非 总 是 如 
此 。 


此 外 ，C 语言 标准 对 于 “指针 ”一 词 是 如 下 定义 的 。 


指针 类 型 (pointer type) 可 以 由 函数 类 型 、 对 象 类 型 或 不 完全 
类 型 派生 ， 派 生 指 针 类 型 的 类 型 称 为 被 引用 类 型 (referenced 
type) 。 指 针 类 型 描述 了 一 种 对 象 ， 其 值 用 于 引用 被 引用 类 型 的 实 


体 。 由 被 引用 类 型 T 派生 的 指针 类 型 称 为 “指向 T 的 指针 ”。 由 被 
引用 类 型 构造 指针 类 型 的 过 程 称 为 “指针 类 型 的 派生 ”。 


这 些 构造 派生 类 型 的 万 法 可 以 递归 地 应 用 。 





这 上 段 话 也 许 会 让 你 一 头 旨 水 毕竟 是 标准 文档 ， 没 那么 好 懂 的 )。 
那 就 先 把 注意 力 放 在 第 一 句 话 上 ， 其 中 出 现 了 “指针 类 型 ”一 词 。 


提 到 类 型 ， 立 刻 会 让 人 想起 int 类 型 、double 类 型 等 。 同 样 


地 ， 在 5 语言 里 还 有 指针 类 型 。 


但 是 一 一 我 得 赶紧 补充 一 下 一 一 指针 类 型 其 实 不 是 单独 存在 的 ， 它 
是 由 其 他 类 型 派生 而 成 的 。 上 面 引 用 的 5 语言 标准 中 也 提 到 了 “由 被 
引用 类 型 T 派生 的 指针 类 型 称 为 “指向 T 的 指针 ””。 


也 就 是 说 ， 实 际 上 存在 的 类 型 是 “指向 int 的 指针 类 型 ”或 “ 指 
问 double 的 指针 类 型 ”。 


因为 指针 类 型 是 类 型 ， 所 以 它 和 int 类 型 、double 类 型 一 样 ， 
也 存在 “指针 类 型 的 变量 ”和 “指针 类 型 的 值 ”。 粳 糕 的 是 ， 指 针 类 
型 、 指 针 类 型 的 变量 和 指针 类 型 的 值 ， 经 常 被 简单 地 统称 为 “指针 ”， 
所 以 请 提高 警惕 ， 务 必 不 要 将 其 混为一谈 。 








要 扣 
先 有 指针 类 型 。 


因为 有 了 指针 类 型 ， 所 以 有 了 指针 类 型 的 变量 和 指针 类 型 的 





例如 ， 在 C6 语言 中 ，int 类 型 用 来 表示 整数 。 因 为 int 是 “类 
型 ”， en int 类 型 的 变量 ， 当 然 也 存在 int 类 型 的 
值 《比如 5 


入 指针 类 型 同样 如 此 ， 既 存在 指针 类 型 的 变量 ， 也 存在 指针 类 型 的 


所 谓 指针 类 型 的 值 ， 实 际 上 就 是 内 存 的 地 址 。 

为 了 更 快 理解 这 一 点 ， 我 们 还 是 写 一 个 程序 来 验证 一 下 。 
1-3-2 和 指针 的 第 一 次 亲密 接触 

下 面 我 们 通过 实际 编程 来 党 试 输出 指针 的 值 〈 代 码 清单 1-4) 。 


代码 清单 1-4 pointer.c 


#include “stdio.hy> 
int main(void) 
int hoge = 5; 


int piyo = 16; 
int *hoge_p; 





/* 输出 各 变量 的 地 址 */ 
printf("&hoge..%p\n", (void*)&hoge); 
printf("&piyo..%p\n", (void*)&piyo); 
printf("&hoge p..%p\n", (void*)&hoge p); 




















/* 将 hoge 的 地 址 赋 给 指针 变量 hoge_p */ 
hoge_p = &hoge; 
printf("hoge p..%p\n", (void*)hoge p); 


/* 通过 hoge_p 输 出 hoge 的 值 */ 
printf("*hoge p..%d\n", *hoge _p); 





/* 通过 hoge_p 更 改 hoge 的 值 */ 
*hoge _p = 16; 
printf("hoge..%d\n", hoge); 





return 0©; 





在 我 的 环境 (Ubuntu Linux 14. 04 LTS x86_64) 中 ， 输 出 结果 如 
下 所 示 。 


&hoge. .6x7fffe6848e86 
&piyo. .6x7fffe6848e84 
&hoge_p. .6x7fffe6848e88 


hoge_p..6x7fffe6848e86 
*hoge_p. .5 
hoge. .16 





第 5 行 第 7 行 声 明了 int 类 型 的 变量 hoge、piyo 和 “指向 


int 的 指针 ”类 型 的 变量 hoge_p。 对 hoge 感到 疑惑 的 读者 ， 请 读 一 
读 1-3-3 节 的 补充 内 容 。 


第 7 行 中 hoge_p 的 声明 语句 如 下 所 示 。 


int *hoge_p; 


这 个 语句 看 似 在 声明 变量 *hoge_p， 实 际 上 并 非 如 此 ， 这 里 声明 
的 是 变量 hoge_p， 其 类 型 为 “指向 int 的 指针 ”。 这 一 点 很 难 理 
解 ， 请 参考 1-3-3 节 的 补充 内 容 。 


int 类 型 的 变量 hoge 和 piyo 在 声明 的 同时 分 别 被 赋值 为 5 和 
10。 


第 10 行 ” 第 12 12 行 表示 使 用 取 地 址 运算 符 & 输出 各 变量 的 地 
址 。 在 我 的 环境 中 ， 变 量 应 该 是 以 如 下 形式 保存 在 内 存 中 的 《图 1- 
3)% 


Ox7fffe0848e80 
Ox7fffe0848e84 


Ox7fffe0848e88 





Ox7fffe0848e90 





图 1-3 变量 的 保存 情况 


从 这 次 的 结果 来 看 ， 似 乎 只 要 变量 是 按照 hoge、piyo、hoge_p 
的 顺序 声明 的 ， 那 么 在 内 存 里 就 也 会 按 这 样 的 顺序 排列 ， 但 其 实 这 只 是 
碰巧 了 而 已 ， 并 非 总 是 如 此 。 变 量 在 内 存 中 的 排列 顺序 与 声明 时 不 同 的 
情况 是 很 常见 的 。 


关键 点 


变量 不 一 定 按 照 声 明 的 顺序 保存 在 内 存 中 。 





前 面 提 到 ， 因 为 有 了 指针 类 型 ， 所 以 有 了 指针 类 型 的 变量 和 指针 类 
型 的 值 。 这 里 输出 的 地 址 就 是 指针 类 型 的 值 。 


不 过 ， 在 使 用 printf() 输出 指针 值 时 ， 要 如 上 例 所 示 使 用 %p。 
此 外 ， 由 于 %p 要 接收 的 是 指向 void 的 指针 ， 所 以 代码 清单 1-4 将 
相应 的 参数 转换 成 了 void* 类 型 。 


”void* 是 可 以 指向 任何 类 型 的 指针 类 型 ， 具 体 见 1-3-4 节 。 





第 15 行将 hoge 的 地 址 赋 给 了 指针 变量 hoge_p。 因 为 hoge 的 
地 址 是 0x7fffe0848e80， 所 以 这 时 内 存 变 为 图 1-4 所 示 的 状态 。 




















Ox7fffe0848e80 

Ox7fffe0848e84 hoge 必 里 保单 
了 hoge 的 地 址 
即 , hoge_Pp 指 

Ox7fffe0848e88 向 hoge 





Ox7fffe0848e90 


图 1-4 将 hoge 的 指针 值 赋 给 hoge_p 


像 这 样 ， 当 指针 变量 hoge_ p 保存 了 另外 一 个 变量 hoge 的 地 址 
时 ， 就 称 为 “hoge_p 指向 hoge”。 


此 外 ， 对 hoge 执行 & 运算 得 到 的 就 是 “hoge 的 地 址 ”。 有 时 
也 称 “hoge 的 地 址 ”的 值 为 “指向 hoge 的 指针 ” (此 时 的 “ 指 
针 ” 指 的 是 “指针 类 型 的 值 ”) 。 

但 是 ， 正 如 前 面 提 到 的 那样 ， 变 量 并 不 一 定 是 按照 声明 的 顺序 保存 


在 内 存 中 的 。 也 就 是 说 ， 纠 结 于 piyo、 人 p 究竟 以 什么 样 
的 顺序 排列 没有 意义 。 因 此 ， 图 1-4 还 可 以 画 成 图 1-5 所 示 的 样子 。 


| 二 是 
匡 强 
图 1-5 网 1-4 的 另 一 种 呈现 方式 


上 图 能 更 直观 地 表现 “hoge_p 指向 hoge” 这 个 含 》 


第 19 行使 用 间接 运算 符 *， 沿 着 hoge_p 按 图 索 骤 ， 从 而 输出 
本 和 的 值 。 


在 指针 前 面 加 上 *， 可 以 表示 指针 指向 的 变量 。 

hoge_p 指向 了 hoge， 所 以 *hoge_p 和 hoge 表示 相同 的 内 
容 。 因 此 ， 一 旦 要 求 输出 *hoge_p， 程 序 就 会 输出 hoge 中 保存 的 值 
5 


由 于 *hoge_p 等 同 于 hoge， 所 以 它 不 只 可 以 用 来 输出 hoge 的 
值 ， 还 可 以 用 来 赋值 。 第 22 行将 10 赋 给 了 *hoge_p， 从 而 改变 了 


hoge 的 值 。 第 23 行 输出 了 hoge 的 值 ， 运 行 结果 为 10。 
关于 指针 的 基础 知识 就 介绍 到 这 里 。 以 下 是 本 节 要 点 。 


要 点 


。 对 变量 使 用 & 运算 符 ， 可 以 获取 该 变量 的 地 址 ， 这 个 地 址 称 为 
指向 该 变量 的 指针 。 


。 在 指针 变量 hoge_p 保存 了 指向 另外 一 个 变量 hoge 的 指针 的 
情况 下 ， 可 以 说 “hoge_p 指向 hoge”。 

。 对 指针 使 用 * 运算 符 ， 可 以 表示 该 指针 指向 的 变量 。 若 
hoge_p 指向 hoge， 则 *hoge_p 等 同 于 hoge。 





1-3-3 ”地 址 运算 符 、 间 接 运算 符 、 下 标 运 算 符 
上 一 节 我 们 将 & 称 为 取 地 址 运算 符 ， 将 * 称 为 间接 运算 符 。 


所 谓 运 算 符 (operator) ， 是 指 以 加 法 运算 中 的 + 为 代表 的 符 
号 ， 用 于 对 表达 式 《有 时 为 多 项 表达 式 ) 进行 某 种 运算 ， 并 返回 作为 运 
算 结果 的 表达 式 。 


在 5 语言 中 ， 获 取 变 量 地 址 的 &、 引 用 指针 指向 内 容 的 * 也 都 是 
运算 符 。 另 外 ， 用 来 引用 数组 元 素 的 【] 也 是 运算 符 ， 我 们 称 之 为 下 标 
运算 符 。 如 a + b 所 示 ，+ 取 两 个 对 象 〈 又 称 为 操作 数 ， 
operand) ， 因 而 称 为 二 目 运算 符 ， 而 & 或 * 只 取 一 个 操作 数 ， 称 为 
单 目 运算 符 。 另 外 ， 由 于 下 标 运算 符 [] 取 数 组 和 下 标 这 两 个 操作 数 
“， 所 以 似乎 也 可 以 称 为 二 目 运算 符 ， 但 在 5 语言 标准 中 ， 它 却 被 归 类 
于 后 置 运 算 符 。 


”准确 来 说 是 “指针 和 下 标 这 两 个 操作 数 ”。1-4-3 节 将 对 此 予以 说 明 。 





不 同 于 加 法 运算 符 + 等 ， 间 接 运 算 符 和 下 标 运算 符 可 以 像 “*a = 
5;” 这 样 向 运算 结果 的 表达 式 赋 值 ， 因 此 我 们 说 运算 结果 的 表达 式 是 左 
值 (lvalue) ， 有 具体 请 参考 3-3-2 节 。 


本 比较 容易 混淆 的 是 如 下 声明 里 的 * 这 种 用 于 声明 指针 或 数组 的 * 
ls 


这 里 的 * 对 于 C6 语言 来 说 不 是 运算 符 。 虽 然 ANS1 C (JIS 
X3010:1993) 中 “6. 1.5 运算 符 ” 里 列举 了 * 、&、[]， 但 声明 时 所 用 
的 * 或 [] 是 归 入 “6.1.6 定 界 符 ”的 *。 换 言 之 ， 声 明 时 所 用 的 
*、[]， 与 表达 式 中 的 运算 符 *、[] 是 风 马 牛 不 相 及 的 。 


”麻烦 的 是 ， 在 C99 里 ， 运 算 符 成 了 定 界 符 的 一 种 ， 而 在 C++ 里 ， 运 算 符 又 被 称 为 
声明 识别 符 。 


补充 关于 本 书 中 的 地 址 值 一 一 16 进 制 表 示 法 


在 解释 地 址 的 概念 时 ， 市 面 上 的 C0 语 言 入 门 书 经 常 使 用 “地 址 
100” 这 种 极其 小 的 10 进 制 值 。 


确实 ， 对 于 初学 者 来 说 ， 可 能 这 样 更 容易 入 门 ， 但 本 书 偏执 地 使 
用 了 16 进 制 来 说 明 。 这 是 因为 ， 想 要 了 解 地 址 的 真正 面目 ， 把 地 址 实 
际 地 输出 出 来 才 是 最 好 的 方式 。 


本 书 示例 程序 的 运行 结果 中 输出 的 所 有 地 址 ， 全 部 都 是 在 我 的 环 


境 中 实际 运行 程序 后 获得 的 。 


如 果 你 还 是 不 太 理解 指针 ， 不 妨 实际 敲 一 遍 示 例 程序 ， 然 后 在 自 
己 的 环境 中 验证 一 下 究竟 会 输出 什么 样 的 地 址 。 可 以 毫 无 疑问 地 说 ， 
你 所 看 到 的 值 同 我 的 环境 里 的 值 是 不 同 的 ， 但 其 中 的 思路 是 一 样 的 。 





补充 混乱 的 声明 一 一 如 何 自然 地 理解 声明 


通常 ，C 语 言 的 变量 声明 是 像 下 面 这 样 ， 即 “类 型 变量 名 
;” 的 形式 。 


it 


然而 ， 像 “指向 int 的 指针 ”类 型 的 变量 ， 却 要 像 下 面 这 样 声 


明 。 

me 
这 里 并 没有 采取 “类 型 变量 名 ;” 的 形式 ， 所 以 有 人 会 将 * 写 

在 靠近 类 型 的 那 边 ， 如 下 所 示 。 


int* hoge_p; 


如 此 一 来 ， 的 确 符合 了 “类 型 变量 名 ;” 的 形式 ， 但 在 同时 声 
明 多 个 变量 时 ， 就 会 出 现 漏洞 。 





/* 未 能 声明 两 个 “指向 int 的 指针 ”类 型 的 变量 ! ”*/ 
int* hoge p, piyo_p; 





”如 果 需 要 同时 声明 两 个 指向 int 的 指针 ， 可 以 使 用 “int *a，*b;” 的 形式 。 
一 一 译 者 注 


另外 ,在 5 语言 中 ， 数 组 也 算 作 一 种 类 型 ， 比 如 在 声明 “int 
的 数组 ”类 型 的 变量 时 ， 要 写成 下 面 这 样 。 


int hoge[16]; 


这 里 无 法 写成 “类 型 变量 名 ;” 的 形式 。 





说 一 些 题 外 话 ，Java 在 声明 “int 的 数组 ”类 型 的 变量 时 ， 通 
常 写成 下 面 这 样 。 


”之 所 以 没有 写 元 素 个 数 ， 是 因为 Java 里 数组 的 元 素 个 数 是 在 new 时 定义 的 。 





这 样 就 符合 “类 型 变量 名 ;” 的 形式 了 。 至 少 在 这 一 点 上 ， 
Java 的 变量 声明 语法 要 比 5 语言 显得 更 为 合理 。 不 过 ， 或 许 是 为 了 
让 C 程序 员 能 够 更 方便 地 转 到 Java 开发 上 ，Java 竟然 也 同时 允许 
使 用 “int hoge[];” 这 样 的 写法 。 这 种 不 伦 不 类 的 做 法 倒 还 真是 
Java 的 一 贯 作 风 。 


我 们 换 一 个 角度 考虑 问题 ， 对 于 下 面 这 个 声明 。 


int *hoge_p; 


由 于 在 hoge_p 前 面 加 上 间接 运算 符 * 时 ， 它 就 会 变 为 int 
类 型 ， 所 以 有 人 可 能 会 产生 下 面 的 想法 。 


看 吧 ， 一 旦 在 hoge_p 前 面 加 上 *， 就 可 以 当 作 int 类 型 处 
理 了 。 也 就 是 说 ， 这 个 声明 意味 着 加 上 * 的 hoge_p 就 是 int 
类 型 。 





这 种 想法 确实 也 能 在 一 定 程度 上 说 得 通 《〈 例 如 ， 数 组 同样 可 以 这 
么 说 ) 。 而 且 ， 针 对 C 语言 的 声明 语法 ，K&R 也 与 道 : “这 种 声明 
变量 的 语法 与 声明 该 变量 所 在 表达 式 的 语法 类 似 。”〔 见 该 书 5. 1 
节 ) 因此 上 面 的 说 法 也 可 以 说 是 顺应 了 C6 语言 作者 的 想法 。 但 是 ， 
假如 像 下 面 这 样 写 ， 还 能 把 hoge 作为 int 类 型 的 变量 来 声明 吗 ? 


int *&hoge; 


一 试 便 知 ， 这 会 导致 一 个 语法 错误 。 


而 且 ， 当 声明 中 出 现 const 时 ， 这 种 说 法 也 会 出 现 破绽 《表达 式 
中 是 不 可 以 出 现 const 的 ) 。 当 我 们 在 指针 类 型 上 使 用 下 标 运算 符 ， 
或 者 对 指向 函数 的 指 针 使 用 匡 数 调用 运算 符 时 ， 所 组 成 的 表达 式 也 无 
法 作为 声明 来 使 用 。 

以 我 的 经 验 来 看 ， 一 切 关 于 “如 果 这 样 考虑 ， 是 不 是 就 可 以 很 自 
然 地 解释 0 语言 的 声明 了 ? ”的 尝试 ， 可 以 打包 票 跟 你 说 ， 最 后 都 会 
2 还 是 0 语言 的 声明 语法 本 来 就 是 不 自然 、 奇 怪 
而 又 变态 


第 3 章 会 详细 解释 关于 声明 的 语法 。 目 前 先知 道 它 是 怎么 回 事 就 
行 ， 姑 且 市 着 问题 继续 往 下 阅读 吧 。 


补充 杂谈 : hoge 是 什么 
本 书 的 示例 程序 里 经 常 使 用 hoge 或 piyo 作 为 变量 名 。 


能 很 多 人 会 想 : “这 是 哈 ? ”在 日 本 ，hoge 这 个 名 称 使 用 得 
es 


人 不过， 因为 是 很 多 年 前 就 在 用 的 词 ， 所 以 也 有 人 说 现在 只 有 大 叔 才 会 使 用 


在 不 知 该 给 变量 或 文件 起 什么 名 字 时 ， 就 可 以 请 hoge 帮 忙 。 


一 般 来 说 ， 应 该 给 变量 取 一 个 有 意义 的 名 称 ， 但 在 像 本 书 这 样 对 
C 语 言语 法 本 身 进行 说 明 时 ， 有 时 很 难 取 什么 有 意义 的 名 称 。 当 然 ， 
哪怕 使 用 a 或 b 这 样 的 名 称 ， 编 译 颖 也 不 会 有 什么 怨言 ， 但 我 觉得 在 面 
Re 母 的 变量 名 似乎 不 太 合适 。 因 为 有 人 
会 依 萌 访 画 标 ， 在 非 示例 程序 的 正 陈 程序 里 也 使 用 单字 母 变 量 名 。 


这 么 看 来 ， 既 能 明确 地 表示 出 变量 名 无 意义 ， 又 不 那么 长 〈 虽 说 
有 4 个 字母 ) 的 hoge 就 是 一 个 很 好 的 选择 。 没 人 知道 是 谁 最 早 开始 使 





用 hoge 的 。 目 前 较 有 力 的 说 法 是 ， 在 20 世 纪 80 年 代 前 半期 ， 日 本 多 
地 开始 广泛 使 用 hoge。 


但 是 ， 即 便 发 现 了 最 早 使 用 hoge 的 案例 ， 也 不 能 肯定 那个 hoge 
人 因此 关于 其 严密 的 起 源 ， 看 来 是 无 
从 得 知 了 。 





1-3-4 ”指针 和 地 址 之 间 的 微妙 关系 


本 章 1-3-1 节 中 与 道 : 


所 谓 指 针 类 型 的 值 ， 实 际 上 就 是 内 存 的 地 址 。 





对 于 这 句 话 ， 有 人 也 许 会 产生 下 面 的 疑问 。 


【常见 疑问 之 1】 


所 谓 指 针 ， 归 根 结 底 就 是 地 址 ， 而 地 址 就 是 内 存 里 被 分 配 的 位 


置 ， 对 吧 ? 那么 ， 说 到 底 指针 类 型 不 就 和 int、1long 这 样 的 整数 类 
型 一 样 吗 ? 





其 实 ， 从 茶 种 意义 上 来 说 ， 这 种 想法 也 不 无 道理 。 


C 语言 的 前 身 B 语言 对 于 指针 和 整数 是 不 进行 区 分 的 。 此 外 ， 虽 
然 在 显示 指针 值 时 ， 通 常 在 printf() 里 使 用 %p， 但 在 int 和 指针 
的 长 度 相 同 〈32 位 的 Windows 或 者 Linux 等 系统 大 多 如 此 ) 的 环境 
中 ， 哪 怕 使 用 %x， 也 可 以 正常 输出 指针 值 “。 对 于 不 太 擅 长 16 进 制 的 
人 来 说 ， 使 用 %d 基本 上 可 以 通过 10 进 制 来 查看 结果 。 


| 





在 64 位 的 操作 系统 中 ， 在 大 多 数 情 况 下 int 和 指针 的 长 度 是 不 
同 的 ， 于 是 有 人 融会 这 样 想 : “如 果 在 64 位 的 操作 系统 中 把 指针 看 作 
long 等 与 指针 长 度 相 同 的 整数 类 型 " ， 是 不 是 就 可 以 认为 指针 和 整数 类 
型 相同 呢 ? ”实际 上 ， 这 种 想法 也 不 成 立 。 正 如 1-3-5 节 的 “常见 疑 
问 之 3” 提 到 的 那样 ， 像 “加 1 ”这样 的 操作 ， 对 指针 和 整数 来 说 就 是 
完全 不 同 的 。 


”从 C99 开始 ，C 就 准备 了 可 以 与 〈 指 向 对 象 的 ) 指针 相互 转换 的 整数 类 型 ， 即 


intptr tt 类 型 。 





另外 ， 在 以 前 广 为 使 用 的 MS-DOS (Microsoft Disk 0perating 
System， 微 软磁盘 操作 系统 ) 的 运行 环境 下 ， 由 于 lntel 8086 的 功能 
限制 ， 需 要 将 两 个 16 位 的 值 组 合 起 来 表示 20 位 的 地 址 。 在 这 种 情况 
下 ， 就 不 能 单纯 地 将 20 位 的 地 址 等 同 于 整数 类 型 。 


还 有 一 一 算 了 ， 还 是 先 回 答 下 一 个 疑问 吧 。 





【常见 疑问 之 2】 


所 谓 指 针 ， 归 根 结 底 就 是 地 址 ， 对 吧 ? 那么 ， 不 论 是 指向 int 


的 指针 ， 还 是 指向 double 的 指针 ， 说 到 底 不 都 是 一 样 的 吗 ? 有 必 
要 进行 区 分 吗 ? 





从 某 种 意义 上 来 说 ， 这 种 想法 也 有 一 定 道理 。 
在 大 多 数 运行 环境 中 ， 当 程序 运行 时 ， 不 论 是 指向 int 的 指针 ， 


还 是 指向 double 的 指针 ， 其 表示 形式 都 是 相同 的 《偶尔 也 会 有 一 些 
运行 环境 ， 对 于 指向 char 的 指针 和 指向 int 的 指针 使 用 不 一 样 的 内 
部 表示 形式 ) 。 


不 仅 如 此 ，ANS1 C 还 为 我 们 准备 了 “可 以 指向 任何 类 型 的 指针 类 
型 ”， 即 void* 类 型 。 


int hoge = 5; 
void *hoge_p; 


hoge_p = &hoge; 《<-- 不 会 报错 
printf("%d\n"，*hoge_p); /* 输出 hoge_p 所 指向 的 内 容 */ 





但 是 ， 像 第 5 行 这 样 在 hoge_p 前 面 加 上 了 * 的 代码 …… 在 我 
的 环境 中 会 报 出 如 下 错误 。 


warning: dereferencing void *' pointer 





error: invalid use of void expression 


稍微 思考 一 下 就 会 发 现 报 错 是 理所当然 的 。 只 告知 了 内 存 上 的 地 
址 ， 却 没有 告知 那里 保存 的 是 什么 类 型 的 数据 ， 当 然 无 法 读 取 。 


但 如 果 把 上 面 的 第 5 行 代码 修改 成 下 面 这 样 ， 不 但 能 够 顺利 通过 
编译 ， 甚 至 能 够 正常 运行 。 


5: printf("%d\n", *(int*)hoge p); /* 将 hoge_p 转 换 成 int */ 





这 里 通过 把 “所 指 类 型 不 明 的 指针 ”hoge_p 转换 成 “指向 int 
的 指针 ”， 为 编译 器 提供 了 类 型 信息 ， 从 而 实现 了 int 类 型 的 值 的 读 
取 。 

但 现实 问题 是 ， 每 次 都 这 样 与 恐怕 会 让 人 不 胜 其 烦 。 不 妨 事先 写 一 
个 下 面 这 样 的 声明 。 


int *hoge_p; 


如 此 一 来 ， 编 译 器 就 能 记 住 “hoge_p 是 指向 int 的 指针 ”， 当 
想 要 通过 指针 获取 值 时 ， 只 要 在 hoge_p 前 加 上 * 就 可 以 了 。 


前 面 也 提 到 ， 在 大 多 数 运 行 环境 中 ， 不 论 是 指向 int 的 指针 ， 还 
是 指向 double 的 指针 ， 在 程序 运行 时 其 表示 形式 都 是 相同 的 。 但 
是 ， 如 果 先 在 int 类 型 变量 前 加 上 & 获取 它 的 指针 ， 再 用 该 指针 获取 
值 ， 那 么 所 获取 的 值 肯定 是 int 类 型 。 毕 竟 int 和 double 的 内 部 
表示 形式 是 完全 不 同 的 。 


因此 ， 在 如 今 的 运行 环境 中 ， 要 是 像 下 面 这 样 获取 指向 double 
类 型 变量 的 指针 ， 并 将 其 赋 给 指向 int 的 指针 变量 ， 那 么 编译 器 必定 


会 发 出 警告 。 


int *int_p; 
double double variable; 





/* 将 指向 double 类 型 变量 的 指针 赋 给 指向 int 的 指针 变量 ( 乱 来 ) */ 


int p = &double variable; 








顺便 提 一 下 ， 在 我 的 环境 里 出 现 了 以 下 警告 。 


warning: assignment from incompatible pointer type 


在 下 一 节 所 讲 的 指针 运算 中 ，“ 编 译 器 会 帮 我 们 记 住 指 针 指向 的 是 
哪 种 类 型 ”这 一 事实 将 具有 重大 意义 。 


补充 “在 运行 时 既 没有 类 型 信息 ， 也 没有 变量 名 
上 面 一 段 提 到 “编译 器 会 帮 有 我 们 记 住 指针 指向 的 是 哪 种 类 型 ”。 


在 C 语 言 中 ， 记 录 指 针 指向 何 种 类 型 是 只 到 编译 器 为 止 的 ， 到 了 
运行 的 时 候 就 已 经 没有 相关 信息 了。 在 运行 时 ， 指 针 的 值 就 只 是 单纯 
的 地 址 而 已 。“ 要 从 这 个 地 址 里 取出 哪 种 类 型 的 值 ” 这 一 信息 只 残留 
在 编译 器 生成 的 机 器 码 中 。 无 论 是 在 指针 的 值 中 ， 还 是 在 指针 指向 的 
变量 的 内 存 空间 中 ， 都 没有 类 型 的 信息 。 因 此 ， 如 果 把 指向 int 的 指 


针 转 换 成 了 void*， 就 不 可 能 再 知道 它 原来 是 指向 int 的 了 。 


另外 ， 对 于 非 static 局 部 变量 〈 自 动 变量 ) ， 通 常 其 变量 名 也 
不 残留 在 编译 后 的 目标 文件 中 。 不 过 ， 通 过 添加 调试 选项 倒是 可 以 使 
之 在 编译 后 残留 ， 而 且 对 于 static 的 局 部 变量 和 全 局 变量 ， 直 到 链 
接 〈 见 第 2 章 ) 时 都 还 是 需要 使 用 变量 名 的 。 但 不 管 怎么 说 ， 到 运行 





的 时 候 就 不 再 需要 使 用 变量 名 了 。 在 图 1-3 中 ， 虽 然 变量 内 存 空间 的 
右上 角 写 着 变量 名 hoge， 但 那 只 是 为 了 方便 说 明 而 已 。 


编译 、 链 接 后 的 机 器 码 在 引用 变量 时 最 终 使 用 的 是 地 址 ， 而 不 是 


变量 名 


那么 这 个 地 址 是 如 何 确定 的 呢 ? 第 2 章 将 予以 说 明 。 





1-3-5 ”指针 运算 
C 语言 的 指针 运算 是 其 他 语言 所 罕见 的 功能 。 


所 谓 指针 运算 ， 就 是 对 指针 进行 整数 加 减 运 算 ， 以 及 指针 之 间 进 行 
减法 运算 的 功能 。 


下 面 我 们 先 来 看 一 下 示例 程序 的 运行 《代码 清单 1-5) 。 


【注意 ! 】 
其 实 严格 来 说 ， 代 码 清单 1-5 并 没有 遵守 6 语言 的 标准 。 


对 于 指针 的 加 减 运算 ， 标 准 只 允许 指针 指向 数组 元 素 ， 或 超过 数 
组 末尾 1 个 元 素 的 位 置 ， 并 且 加 减 运算 的 结果 也 指向 数组 元 素 ， 或 
超过 数组 末尾 1 个 元 素 的 位 置 〈4-2-11 节 ) 。 对 于 除 此 以 外 的 情 
况 ， 标 准 没 有 定义 。 


这 次 的 示例 程序 最 终 向 hoge_p 加 了 4， 所 以 这 是 违反 标准 规 
定 的 ， 哪 怕 最 后 并 没有 通过 该 指针 进行 内 存 访问 。 不 过 ， 我 觉得 这 个 
程序 在 大 部 分 运行 环境 中 是 能 够 运行 的 ， 所 以 比 起 严守 标准 ， 这 里 还 
是 选择 了 程序 的 简单 性 。 


代码 清单 1-5 pointer calc.c 





#include <stdio.h> 


int main(void) 

{ 
int hoge; 
int *hoge_p; 


/* 将 指向 hoge 的 指针 赋 给 hoge_p */ 

hoge_p = &hoge; 

/* 输出 hoge_p 的 值 */ 

printf("hoge p..%p\n", (void*)hoge p); 
/* hoge_p 加 1 */ 

hoge_p++; 

/* 输出 hoge_p 的 值 */ 











printf("hoge p..%p\n", (void*)hoge p); 
/* 输出 hoge_p 加 3 后 的 值 */ 
printf("hoge p..%p\n", (void*)(hoge p + 3)); 





return 0©; 


6x7fffc7d66af4 <-- 最 初 的 值 
6x7fffc7d66af8 <-- 加 1 之 后 的 值 
e@x7fffc7d66b84 <-- 加 1 之 后 再 加 3 的 值 
































第 9 行 用 于 将 指向 hoge 的 指针 赋 给 hoge_p， 第 11 行 用 于 输 
出 该 值 。 在 我 的 环境 中 ，hoge 是 存放 在 地 址 0x7fffc7d60af4 里 的 。 


第 13 行 是 使 用 ++ 运算 符 对 hoge_p 加 1。 


试 着 输出 结果 …… 本 来 以 为 加 1 之 后 地 址 也 增加 1， 可 不 知 为 
何 ， 地 址 从 0x7fffc7d60af4 变 成 了 0x7fffc7d60af8， 增 加 了 4。 


第 17 行 用 于 输出 hoge_p 加 1 之 后 再 加 3 的 结果 ， 不 过 结果 
是 从 0x7fffc7d60af8 变 成 0x7fffc7d60b04， 增 加 了 12。 


这 正 是 指针 运算 的 特征 。 在 C 语言 中 ， 对 指针 加 1 后 ， 其 地 址 就 
增加 该 指针 所 指向 的 类 型 的 长 度 。 示 例 程序 中 的 hoge_p 是 指向 int 
的 指针 ， 而 在 我 的 环境 中 int 的 长 度 是 4， 所 以 对 地 址 来 说 ， 加 1 就 
是 前 进 4 字 节 ， 加 3 就 是 前 进 12 字 节 。 


要 点 
对 指针 加 n， 则 指针 前 进 “ 该 指针 所 指向 的 类 型 的 长 度 x 
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【常见 疑问 之 3】 
所 谓 指 针 ， 归 根 结 底 就 是 地 址 ， 对 吧 ? 
那么 ， 给 指针 加 1， 指 针 难 道 不 应 该 前 进 1 字 节 了 吗 ? 





这 个 疑问 非常 合理 ， 但 要 想 真 正 理解 ， 需 要 先 弄 清楚 5 语言 中 数 
组 与 指针 的 微妙 关系 一 一 为 何 C 语言 中 存在 指针 运算 这 样 奇怪 的 功能 
呢 ? 


对 此 ， 我 们 会 在 稍 后 子 以 说 明 ， 现 阶段 姑且 带 着 疑问 继续 往 下 | 阅读 
吧 。 
1-3-6 何谓 空 指 针 
空 指针 (null pointer) 是 一 个 特殊 的 指针 值 。 


它 是 一 个 保证 不 指向 任何 地 址 的 指针 。 我 们 通常 使 用 安定 义 NULL 
作为 表示 空 指针 的 常量 值 。 


由 于 空 指针 可 以 确保 与 任何 非 空 指针 进行 比较 都 不 相等 ， 所 以 经 常 
作为 返回 指针 的 函数 发 生 异 常 时 的 返回 值 使 用 。 另 外 ， 对 于 第 5 章 将 
介绍 的 链表 这 种 数据 结构 ， 我 们 也 会 在 其 末尾 放 入 空 指针 ， 表 示 “ 后 面 
已 经 没有 数据 了 哦 ”。 


如 今 在 大 部 分 情况 下 ， 应 用 程序 一 旦 试图 通过 空 指针 引用 对 象 ， 操 
作 系 统 就 会 检 出 异常 ， 并 立刻 终止 程序 ， 所 以 只 要 每 次 都 用 NULL 初始 


化 指针 ， 那 么 在 误 用 了 无 效 〈 未 初始 化 ) 的 指针 时 ， 就 能 够 立刻 发 现 
Bug。 


对 于 一 般 的 指针 ， 我 们 可 以 根据 其 指向 的 类 型 明确 地 进行 区 分 。 如 
果 把 指向 int 的 指针 赋 给 指向 double 的 指针 变量 ， 则 如 前 所 述 ， 如 
今 的 编译 器 会 发 出 警告 。 但 唯 独 NULL， 不 论 对 方 是 指向 什么 类 型 的 指 
针 ， 都 可 以 进行 赋值 和 比较 。 


我 曾 见 过 一 段 在 特地 对 空 指针 执行 类 型 转换 之 后 进行 赋值 和 比较 的 
程序 ， 这 不 仅 徒劳 无 功 ， 反 而 使 得 代码 难以 阅读 。 


补充 NULL 和 0 和 “'\0' 


我 们 经 常会 见 到 这 样 一 种 错误 的 代码 写法 : 在 字符 串 的 末尾 使 
用 NULL。 


/* 
* Cc 语言 的 字符 串 是 以 '\8' 结 尾 的 ， 而 strncpy() 是 一 个 麻烦 的 
* 当 src 的 长 度 大 于 len 时 就 无 法 以 '\@' 结 尾 

















凑 
业 




















函 
* 所 以 就 想 写 一 个 能 够 将 字符 串 整 理 成 符合 C 语 言 字符 串 格 式 的 函数 
*/ 
void my_strncpy(char *dest, char *src, int len) { 
strncpy(dest, src, len); 
dest[len] = NULL; <-- 没 想到 这 里 却 使 用 NULL 来 结束 字符 串 ! 














} 
字符 串 使 用 NULL 结 尾 ! 


这 段 代 码 虽 然 在 某 些 环境 中 是 能 够 运行 的 ， 但 它 的 确 是 错误 的 代 
码 。 字 符 串 要 以 空 字符 〈'\8') 结尾 ， 而 不 能 使 用 空 指 针 来 结尾 。 


C 语 言 标 准 里 对 空 字符 的 定义 是 “所 有 位 均 为 0 的 字 节 称 为 空 字 符 
(null character) ”。 也 就 是 说 ， 空 字符 是 值 为 0 的 char 类 型 。 

空 字符 通常 使 用 '\9' 表示。 因为 '\e' 是 字符 常量 ， 所 以 实际 上 
等 同 于 常量 0。 可 能 你 会 感到 惊讶 ， 但 '\8' 或 者 'a' 之 类 的 ， 它 们 的 
数据 类 型 其 实 并 不 是 char 而 是 int”。 








| ”但 到 了 C++ 里 ， 情 况 就 又 不 一 样 了 。 


另外 ， 在 我 的 环境 中 ，NULL 在 stdio.h 里 的 定义 如 下 所 示 ”。 


”虽然 如 今 的 头 文件 一 般 都 会 谋 套 使 用 ， 或 者 使 用 #ifdef 代码 块 等 ， 但 如 果 通 
过 gcc 的 -E 选项 只 进行 预 编译 ， 那 就 可 以 查看 自己 的 环境 里 具体 是 怎样 定义 的 。 








#define NULL ((void*)0@) 


8 被 强制 转换 成 了 void*， 也 就 是 说 成 为 了 指针 ， 所 以 在 将 它 
赋 给 char 的 数组 时 ， 现 在 的 编译 器 应 该 会 发 出 警告 。 


可 是 ， 看 到 NULL 的 这 个 定义 ， 可 能 有 人 会 产生 下 面 的 想法 。 


什么 呀 ， 所 谓 空 指 针 ， 不 就 是 零 地 址 嘛 。 


在 5 语言 中 ， 零 地 址 上 肯定 是 不 能 存放 有 效 数 据 的 吧 ? 虽然 
在 某 些 情况 下 会 浪费 1 字 节 的 空间 ， 不 过 这 也 没什么 大 不 了 的 。 





这 个 推测 看 似 很 有 道理 ， 但 还 是 稍稍 跑 偏 了 一 点 。 
的 确 ， 大 部 分 运行 环境 是 把 零 地 址 当 作 空 指针 处 理 的。 然而 ， 在 


菜 些 运行 环境 中 ， 硬 件 状 况 等 也 可 能 会 导致 其 空 指针 的 值 并 不 是 0。 


有 人 会 在 获取 结构 体 之 后 先 用 memset() 将 结构 体内 存 清 零 再 
使 用 。 另 外 ， 虽 然 C 语言 提供 了 动态 内 存 分 配 函 数 malloc() 和 
calloc(), 但 有 些 人 认为 有 清 零 操作 比较 好 ， 因 而 偏好 使 用 
calloc()。 从 避免 再 现 性 差 的 Bug 的 角度 来 说 ， 这 也 许 是 一 个 有 效 


的 策略 ， 但 是 …… 


使 用 memset() 或 calloc() 将 内 存 空间 清 零 ， 其 实 只 是 单纯 
地 使 用 0 填充 位 而 已 。 因 此 ， 当 以 这 种 方式 清 零 后 的 结构 体 成 员 中 
含有 指针 时 ， 这 个 指针 是 否 能 被 用 作 空 指针 呢 ? 这 说 到 底 还 是 取决 于 
运行 环境 。 

顺便 说 一 下 ， 浮 点 数 也 是 这 样 的 ， 即 便 它 的 位 模式 为 0， 其 值 也 
不 一 定 就 是 0 。 


a ”虽然 整数 类 型 的 值 会 变 成 0， 但 我 依然 认为 ， 依 赖 这 种 方式 编写 的 代码 是 非常 脏 





说 到 这 里 ， 或 许 有 人 会 悦 然 大 司 : 


哦 ， 原 来 如 此 ， 怪 不 得 要 用 宏 定义 NULL 呢 。 在 空 指针 的 值 
不 为 0 的 运行 环境 中 ，NULL 的 值 被 #define 定义 成 别 的 值 了 
啊 。 





但 是 ， 实 际 上 这 种 想法 也 跑 偏 了 ， 而 这 正 是 这 个 问题 之 所 以 深 
奥 的 原因 所 在 。 


例如 ， 我 们 来 试 着 编译 下 面 的 程序 
在 我 的 环境 里 ， 编 译 器 会 给 出 以 下 警告 


3 肯定 是 int 类 型 ， 而 指针 和 int 的 数据 类 型 不 同 ， 所 以 编 


译 器 会 给 出 警告 。 如 今 的 运行 环境 基本 上 都 会 给 出 警告 


那么 ， 接 下 来 再 试 着 编译 下 面 的 程序 


这 次 竟然 没有 给 出 警告 


如 果 说 是 将 int 类 型 的 值 赋 给 指针 而 导致 编译 器 给 出 警告 的 ， 
那么 赋 3 会 给 出 警告 ， 而 赋 0 却 不 会 ， 这 简直 匪夷所思 ! 


这 是 因为 ， 在 5 语言 “在 应 当 作 为 指针 处 理 的 上 下 文中 ，0 
| s 指 针 处理 ” 。 在 这 次 的 示例 中 ， 因 为 赋值 对 象 是 
所 以 编译 器 判断 当前 为 “应 当 作 为 指针 处 理 ” 的 情况 ， 因 而 将 
0 解读 成 了 空 指针 。 


像 这 样 ， 在 应 当 作为 指针 处 理 的 上 下 文中 ， 编 译 器 无 论 如 何 都 会 
对 常量 0 进行 特别 处 理 ， 所 以 在 空 指针 的 值 不 为 0 的 运行 环境 中 ， 
以 常量 0 替代 空 指针 也 是 合法 的 。 


因此 ， 在 有 些 运 行 环境 中 ，NULL 的 定义 如 下 所 示 。 


#define NULL 6 


但 是 ， 编 译 器 也 会 遇 到 无 法 识别 “应 当 作 为 指针 处 理 的 上 下 
文 ” 的 情况 ， 比 如 : 


。 未 进行 原型 声明 的 函数 的 参数 
。 可 变 长 参数 函数 中 可 变 部 分 的 参数 


由 于 ANSI 5 里 引入 了 原型 声明 ， 所 以 只 要 正确 使 用 原型 声明 ， 
编译 怖 是 能 够 理解 “要 传递 指针 ”这 个 情况 的 。 


但 是 ， 对 于 以 printf() 为 代表 的 可 变 长 参数 函数 中 可 变 部 分 
的 参数 类 型 ， 编 译 咒 是 无 法 理解 的 。 另 外 ， 麻 烦 的 是 ， 常 量 NULL 
会 被 用 于 表示 可 变 长 参数 函数 中 人 参数 的 结束 〈 典 型 的 是 UNIX 的 系统 
调用 水 数 exec1()) 。 


在 这 种 情况 下 ， 单 单传 递 常 量 0 的 程序 ， 可 以 说 是 可 移植 性 差 
的 程序 。 


* 对 此 ， 史 蒂 芬 ， 萨 米 特 在 《你 必须 知道 的 495 个 C 语言 问题 》[3] 中 耗费 了 一 
整 章 的 篇 幅 进 行 了 讨论 。 


嘻 ! 明明 只 是 要 补充 一 点 内 容 ， 却 不 知 不 觉 瑟 了 这 么 多 
各 位 初学 者 只 要 先 记 住 以 下 内 容 就 可 以 了 。 


. re 指针 
'\8' 表 示 空 字符 


然而 ，C++ 之 父 本 贾 尼 : 斯 特 劳 斯 特 卢 普 却 推荐 使 用 0 表示 空 指 
针 …… 可 真 有 麻烦 啊 ! 





1-3-7 ”实践 一 一 从 函数 返回 多 个 值 


一 旦 开始 讲解 C 指针 ， 就 会 有 人 说 : “ 真 搞 不 懂 为 什么 非得 使 用 
指针 这 种 东西 ! ” 

对 于 这 个 疑问 ， 经 常 有 人 回答 说 “因为 用 指针 能 写 出 相对 高 效 的 程 
序 ” 或 者 “因为 能 写 出 贴近 硬件 的 程序 ”。 但 是 ， 即 便 不 在 意 运行 速 
度 ， 或 者 不 写 与 硬件 密切 相关 的 程序 ， 要 用 5 语言 写 出 实用 的 程序 ， 
也 必须 使 用 指针 ， 比 如 以 下 情况 


)1. 从 函数 返回 多 个 值 
)2. ES RR 


)3. 表示 链表 、 树 形 结构 这 样 的 数据 结构 〈 第 5 章 ) 
本 市 我 们 来 讲解 一 下 第 1 点 。 
如 果子 数 仅 返回 一 个 值 ， 使 用 返回 值 即 可 。 但 是 ， 例 如 想 要 编写 获 


取 某 个 点 的 x 坐标 和 y 坐标 的 函数 ， 就 必须 返回 x 坐标 和 y 坐标 这 
两 个 值 。 在 这 种 情况 下 ， 可 以 将 指针 传递 给 参数 。 


代码 清单 1-6 将 main() 函数 的 变量 x 和 y 的 地 址 传递 给 函 
数 get_xy()， 然 后 get_xy() 将 值 保 存 到 了 这 文 两 个 地 址 里 。 


代码 清单 1-6 get xy.c 


#include “stdio.hy> 
void get xy(double *x p, double *y_p) 
/* 输出 形 参 x_p 和 y_p 的 值 及 地 址 */ 


printf("x_p..%p, y_p..%p\n", (void*)x p, (void*)y _p); 
printf("&x p..%p, &y_p..%p\n", (void*)&x p, (void*)&y_p); 








/* 将 值 保 存 到 以 参数 传递 进来 的 地 址 中 */ 
*x bp := 103 
*y p = 2.0; 





main(void) 


double x; 
double y; 


/* 输出 变量 x 和 y 的 地 址 */ 
printf("&x..%p, &y..%p\n", (void*)&x, (void*)&y); 











/* 
* 将 变量 x 和 y 的 地 址 作为 参数 传递 
* get_xy() 将 值 保 存 到 这 两 个 地 址 里 
*/ 
get_xy(&x, &y); 


/* 输出 接收 的 值 */ 
printf("x..%f, y..%f\n", x, y); 











return 0©; 





在 我 的 环境 中 ， 结 果 如 下 所 示 。 


&x. .6x7fffef685f26，&y. .9x7fffef685f28 
x_p..6x7fffef685f20, y..6x7fffef685f28 


&x_p..6x7fffef685ef8, &y_p..6x7fffef685ef0 
X..1.00060006，y..2.000060 





可 以 看 到 ，get_xy() 里 指定 的 值 1.0 和 2.0 已 经 返回 给 
main() 函数 了 。 


另外 ， 我 做 了 一 个 实验 ， 通 过 第 20 行 输出 了 变量 x 和 y 的 地 
址 ， 通过 第 6 行 输出 了 get_xy() 中 的 形 参 x_p 和 y_p 的 值 ， 并 
通过 第 7 行 输出 了 地 址 ， 具 体 如 图 1-6 所 二 


© 
Ox7fffef685ef0 


Ox7fffef685f28 


Ox7fffef685ef8 


Ox7fffef685f20 


Ox7fffef685f00 修一 一 一 一 一 一 一 一 J y_p 指 向 y 
ES 


Ox7fffef685f20 


图 1-6 从 函数 返回 多 个 值 

由 此 可 见 ， 程 序 将 main() 函数 的 x 和 y 的 指针 作为 参数 传递 
给 了 函数 get_xy()， 并 通过 它们 对 疯 数 get_xy() 执行 了 写 值 操 
作 。 在 C 语言 中 ， 这 种 情况 不 用 指针 是 无 法 实现 的 。 


或 许 有 人 觉得 像 代码 清单 1-7 这 样 也 能 够 实现 对 x 和 y 赋值 ， 


品 
”™ 








但 事实 并 非 如 此 。 


代码 清单 1-7 get xy bad.c 


#include <stdio.h> 


void get xy(double x, double y) 





/* 输出 形 参 x 和 y 的 值 及 地 址 */ 
printf("get xy: x..%f, y..%f\n", x, y); 


printf("get xy: &x..%p, &y..%p\n", (void*)&x, (void*)&y); 
x 1.0; 


y 2.0; 





main(void) 


double x 10 .0; 
double y = 20.0; 


printf("main: &x 


..%p, &y..%p\n", (void*)&x, (void*)&y); 
get_xy(x, y); 


printf("x..%f, y..%f\n", x, y); 


return 0©; 





在 我 的 环境 中 ， 代 码 清单 1-7 的 运行 结果 如 下 所 示 。 如 你 所 见 ， 
没 能 将 1.0 和 2.0 赋 给 main() 函数 的 x 和 y。x 和 y 的 值 还 是 
通过 第 14 行 第 15 行 实现 初始 化 时 的 值 ， 即 10.0 和 20. 0。 


main: &x..9x7fff78ba6cf6，&y..69x7fff78ba6cf8 
get xy: x..10.60060060, y..20.60600600600 


get xy: &x..0x7fff78ba6cc8, &y..6x7fff78ba6ccO 
xX..10.60006006060,，y..20.06000060060 





代码 清单 1-7 的 第 17 行 输出 了 main() 函数 中 x 和 y 的 地 
址 ,第 6 行 `" 第 7 行 输出 了 get_xy() 函数 中 x 和 y 的 值 及 地 址 。 


如 你 所 见 ， 它 们 分 别 保存 在 不 同 的 地 址 中 ， 所 以 是 不 同 的 变量 。 无 论 怎 
么 修改 get_xy() 函数 中 x 和 y 的 值 ， 都 无 法 改变 main() 函数 中 
x 和 y 的 值 。 


在 C6 语言 中 进行 通 数 调用 时 ， 人 参数 是 作为 值 传 递 的 ， 这 称 为 值 传 
递 (call by value) 。 


即使 像 get_xy(x，y) 这 样 想 要 传递 变量 x 和 y， 实 际 传递 给 被 
调用 方 函 数 的 也 还 是 那个 时 间 点 的 x、y 中 所 赋 的 值 〈 从 实际 情况 来 
看 ， 代 码 清单 1-7 第 6 行 的 printf() 输出 的 是 10.0 和 20.0) 。 
然后 ， 这 些 值 被 赋 〈 复 制 ) 给 被 调用 方 函 数 的 形 参 ， 接 下 来 形 参 就 可 以 
像 普 通 的 局 部 变量 一 样 使 用 了 。 


不 论 是 像 代码 清单 1-6 那样 传递 指针 ， 还 是 像 代 码 清单 1-7 那样 
传递 double 类 型 ， 这 个 处 理 过 程 都 是 一 样 的 。 


“从 函数 返回 多 个 值 ” 的 情况 在 实际 的 程序 中 也 是 很 常见 的 。 特 别 
是 函数 的 返回 值 经 常用 于 返回 成 功 或 失败 的 状态 ， 因 此 ， 如 果 除 此 之 外 
还 要 返回 其 他 值 ， 那 就 只 能 像 这 样 通过 指针 实现 。scanf() 是 一 个 连 
初学 者 都 很 熟悉 的 函数 ， 用 于 从 键盘 输入 值 。scanf() 也 是 用 &hoge 
i 然后 在 scanf() 里 把 值 装载 进去 


另外 ,在 C++ 和 c## 中 ， 有 一 个 称 为 引用 传递 的 功能 ， 使 用 这 个 
功能 ， 即 便 不 像 C 语言 那样 显 式 地 使 用 指针 ， 也 可 以 在 参数 中 指定 变 
量 ， 从 而 接收 值 。 但 是 5 语言 中 没有 引用 传递 ， 所 以 只 能 通过 对 指针 
进行 值 传 递 来 向 指针 指向 的 地 址 产 载 值 。 


补充 形 参 与 实 参 


总 学 得 “ “ 实 参 ”这 两 个 词 在 大 多 数 0 语 言 入 | ] 书 里 虽然 
会 说 明 ， 但 都 只 是 点 到 为 止 ， 经 常 让 人 搞 不 清 到 许 哪 个 是 哪个 。 


在 调用 函数 时 实际 传递 的 参数 是 实 参 。 








接收 实 参 的 一 方 是 


void func(int hoge) <-- 这 个 hoge 是 形 参 


{ 
} 


在 下 文中 ， 这 两 个 词 出 现 的 频率 会 很 高 ， 干 万 不 要 搞 混 了 。 


1-4 关于 数组 | 


1-4-1 ”使 用 数组 


所 谓 数组 ， 就 是 指 相 同类 型 的 变量 以 确定 的 个 数 排列 而 成 的 集合 。 
话 不 多 说 ， 我 们 先 来 试 着 用 一 下 代码 清单 1-8) 。 





代码 清单 1-8 array.c 











1 #include <stdio.h> 

2 

3 int main(void) 

44 

5 int array[5]; 

6 int i; 

7 

8 /* 对 数组 array 设 置 值 */ 

9 for (i = 6; i < 5; i++) { 
16 array[i] = i; 
11 } 
12 
13 /* 输出 其 内 容 */ 
14 for (i = 6; i < 5; i++) { 
15 printf("%d\n", array[i]); 
16 } 





18 /* 输出 array 中 各 元 素 的 地 址 */ 


19 for (i = 68; i «< 5; i++) { 

20 printf("&array[%d]... %p\n", i, (void*)&array[i]); 
21 } 

22 

23 return ©; 





运行 结果 如 下 所 示 。 


&array[6]... 6x7fff64819166 
&array[1]... 6x7fff64819164 
&array[2]... 6x7fff64819168 
&array[3]... 6x7fff6481916c 
&array[4]... 6x7fff64819176 





第 5 行 用 于 将 array 声明 为 数组 类 型 的 变量 。 


9 行 第 11 行 用 于 对 array 的 各 元 素 设 置 值 。 这 里 只 是 单纯 
地 将 0 赋 给 array[6]， 将 1 赋 给 array[1]， 以 此 类 推 按 顺 序 赋 
值 。 


口 洪 


第 14 行 第 16 行 用 于 输出 其 内 容 ， 即 运行 结果 中 的 前 5 行 。 


第 19 行 ` 第 21 行 用 于 输出 数组 中 名 元 素 的 地 址 。 从 运行 结果 可 
以 看 到 ， 每 个 地 址 之 间 的 间隔 为 4 字 节 。 


在 我 的 环境 中 ，int 的 长 度 恰恰 是 4 字 节 ， 因 此 内 存 中 的 情况 如 
1-7 所 示 。 数 组 就 是 这 样 在 内 存 上 壬 彝 分 布 的 。 


Ox7fff04819160 


Ox7fff04819164 


Ox7fff04819168 


array [2] 


0 Er 
array [3] 

TT Er 
array [4] 





图 1-7 数组 在 内 存 中 的 分 布 


1-3-5 节 提 到 ， 对 指针 加 n， 则 指针 前 进 “ 该 指针 所 指向 的 类 型 的 
pa 度 x 2 


这 一 所 在 此 处 生动 地 表现 了 出 来 ， 具 体 将 在 下 一 市 说 明 。 


补充 C 语言 的 数组 是 从 0 开始 的 
在 5 语言 中 ， 如 下 所 示 声 明 一 个 数组 。 
这 里 指定 了 数组 元 素 个 数 为 10， 由 于 在 5 语言 中 数组 下 标 是 从 


0 开始 的 ， 所 以 通过 这 个 声明 ， 我 们 可 以 使 用 hoge[86] 
hoge[9]， 但 不 能 使 用 hoge[16]。 


这 个 规则 常 使 初学 者 感到 混乱 。 


例如 世上 最 早 的 编程 语言 FORTRAN 的 数组 就 是 从 1 开始 的 。 既 
ee 那 可 能 就 说 明 对 于 人 类 来 说 ，“ 从 1 开始 数 数 ” 是 自然 而 
然 的 事情 。 





但 是 ， 请 试 着 思考 一 下 。 


例如 我 工作 的 地 方位 于 日 本 名 古 屋 市 某 栋 大 楼 的 5 楼 ， 某 人 把 
一 层 楼 需要 10 秒 ， 那 么 从 地 面 上 到 5 楼 需要 花费 多 少 秒 ? 50 秒 ? 
很 遗憾 ， 正确 答案 是 40 秒 。 


想必 大 家 在 中 学 都 学 过 等 差 数 列 ， 等 差 数列 的 第 n 项 等 于 “ 首 
项 + 公差 Xx (n - 1)”。 每 个 都 要 减 1， 真 麻烦 …… 


此 外 ，“1900 年 代 ” 并 不 是 19 世纪 ， 它 的 一 大 半 属 于 20 世 
纪 。 更 加 复杂 的 情况 是 ，2000 年 不 属于 21 世纪 ， 而 属于 20 世 
纪 。 


这 些 问 题 分 别 可 通过 以 下 方式 回避 。 
。 把 大 楼 里 与 地 面 等 高 的 那 层 计 作 第 0 层 
。 把 数列 的 首 项 计 作 第 0 项 
。 把 最 初 的 世纪 计 作 0 世纪 ， 把 公历 最 初 的 年 份 计 作 0 年 
这 种 “ 差 1 错误 ”的 问题 在 编程 中 经 常 发 生 。 因 此 ， 普 遍 认为 
在 一 般 情况 下 如 果 以 0 为 基准 编号 ， 那 么 通常 〈 并 不 是 所 有 ) 能 回 
避 这 类 问题 。 
如 果 还 是 无 法 理解 ， 那 我 们 再 举 一 个 编程 中 的 例子 来 看 一 下 。 


在 5 语言 中 可 以 使 用 二 维 数 组 (准确 来 说 是 “数组 的 数 
组 ”) ， 但 其 长 度 在 编译 时 必须 是 已 知 的 ”。 


, ”在 C99 中 ， 可 以 定义 长 度 可 变 的 二 维 数组 ， 不 过 仅 限于 局 部 变量 (自动 变 


= 
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此 处 ， 假 设 我 们 非 要 用 一 维 数组 来 代替 长 度 可 变 的 二 维 数 组 ， 则 
数组 如 下 所 示 。 





/* width 是 行 的 长 度 ， 引 用 1ine 行 co1 列 的 元 素 */ 


| array[line * Width + coll] 


如 果 把 前 行 计 作 第 1 行 ， 前 列 计 作 第 1 列 ， 并 且 数 组 array 
的 下 标 从 1 开始 ， 那 就 需要 像 下 面 这 样 调 整 代码 中 的 line。 


array[(line-1) * width + col] 


C 语言 的 数组 之 所 以 从 0 开始 ， 一 个 原因 就 是 为 了 迎合 语法 
(后 述 ) 。 


但 用 习惯 之 后 ， 比 起 从 1 开始 的 数组 ， 从 0 开始 的 数组 要 方便 


这 年 头 的 内 存 都 大 得 很 ， 所 以 在 声明 数组 时 多 一 个 元 素 长 度 ， 
下 标 束 从 1 开始 使 用 好 了 。 


比 起 这 种 敷衍 了 事 的 想法 ， 还 不 如 去 习惯 使 用 从 0 开始 的 数 
组 ， 除 非 你 正在 移植 FORTRAN 的 程序 。 





1-4-2 ”数组 与 指针 的 微妙 关系 


如 前 所 述 ， 对 指针 加 n， 则 指针 前 进 “ 该 指针 所 指向 的 类 型 的 长 度 
X n”。 


也 就 是 说 ， 对 指向 数组 中 某 个 元 素 的 指针 加 n， 则 该 指针 就 会 指向 
其 n 个 元 素 之 后 的 元 素 。 


我 们 通过 下 面 的 程序 来 验证 一 下 《代码 清单 1-9) 。 


代码 清单 1-9 array2. c 


01 #include <stdio.h> 


int main(void) 
{ 
int array[5]; 
int *p; 
int i; 
/* 对 数组 array 设 置 值 */ 


for (i = 6; i 5; i++) { 
array[i] = i; 











/* 输出 其 内 容 (指针 版 〉 */ 
for (p = &array[6]; p != &array[5]; p++) { 
printf("%d\n", *p); 





return 0©; 





a 运行 结果 如 下 所 示 ， 与 代码 清单 1-8 的 运行 结果 中 前 半 部 分 是 一 
样 的 。 


入 WOOPO 


第 15 行 的 for 语句 是 先 将 指针 类 型 变量 p 指向 array[6]， 随 
后 通过 p++ 顺序 递增 ， 直 到 指向 array[5] (虽然 它 并 不 存在 ) 为 止 
(图 1-8) 。 


欧 


人 一 开始 指向 


array [0] 
sre 
CO) 在 p 逐 一 递增 i array [1] 
的 同时 输出 
xD i 
一 -一 > array [2] 








加 在 指向 array[5] 。 王 > 
时 终止 循环 实际 
十 终止 循环 C Be ( 实际 上 array [5] 
一 并 不 存在 ) 


图 1-8 利用 指针 输出 数组 的 值 


使 用 ++ 运算 符 对 指针 加 1， 指 针 就 会 前 进 sizeof(int) 个 字 
节 ， 很 巧妙 。 


另外 ， 把 第 15 行 第 17 行 改 写成 下 面 这 样 也 是 可 以 的 《姑且 称 
之 为 “改写 版 ”) 。 


/* 使 用 指针 输出 数组 的 内 容 〈 改 写 版 ) */ 
p = &array[6]; 


for (i = 6; i < 5; i++) { 
printf("%d\n", *(p + i)); 





} 


采用 这 种 写法 ， 指 针 类 型 变量 p 的 值 并 不 是 逐一 增加 的 ， 而 一 直 
是 固定 的 ， 在 输出 时 才 加 上 i。 


那么 ， 你 觉得 这 种 写法 容易 阅读 吗 ? 


至 少 在 我 看 来 ， 不 论 是 写成 pt+， 还 是 *(p + i)， 都 非常 难以 阅 
读 。 还 是 像 一 开始 的 例子 中 的 array[i] 那样 的 写法 更 容易 理解 。 


事实 上 ， 本 书 的 主张 是 ， 使 用 指针 运算 的 写法 难以 阅读 ， 所 以 让 我 
们 抛弃 这 种 写法 吧 。 


但 是 ， 且 不 论 写 法 是 好 是 坏 ，5 语言 中 现实 存在 的 指针 运算 这 一 功 
能 真 的 很 奇 荡 。 关 于 6 语言 中 为 什么 会 有 指针 运算 这 样 的 奇 苑 功能 ， 
我 们 稍 后 将 予以 说 明 。 
1-4-3 下 标 运算 符 [] 与 数组 毫 无 关系 

上 一 节 的 “改写 版 ”程序 是 像 下 面 这 样 将 指针 指向 数组 开头 的 。 

其 实 ， 使 用 下 面 这 种 写法 也 可 以 。 


关于 这 个 写法 ， 有 人 会 像 下 面 这 样 说 明 。 


在 6 语言 中 ， 如 果 在 数组 名 后 不 加 []， 而 只 写 数 组 名 ， 那 么 此 


名 称 就 表示 “指向 数组 初始 元 素 的 指针 ”。 





在 此 ， 我 可 以 明确 地 告诉 大 家 ， 上 面 的 说 明 是 错误 的 ”。 


”或 许 应 该 出 于 礼貌 勉 为 其 难 地 说 : “这 个 说 明 并 不 一 定 是 错误 的 。” 但 考虑 到 实际 


0 A 





实际 上 ， 不 论 有 没有 []， 在 表达 了 式 中 ， 数 组 都 会 被 解读 成 指向 其 
初始 元 素 的 指针 。 


或 许 很 多 人 不 明白 我 在 说 什么 ， 那 就 让 我 们 一 步 一 步 说 明 一 下 。 
这 里 把 &array[8] 替换 成 array， 进 一 步 将 “改写 版 ”程序 修改 


成 下 面 这 样 。 





p = array; 《<-- 只 修改 了 这 里 
for (i = 6; i «< 5; i++) { 


printf("%d\n", *(p + i)); 
} 





男 外 ， 在 这 个 程序 中 ，*(p + i) 这 部 分 也 可 以 写成 p[i]。 


p = array; 
for (i = 6@; i < 5; i++) { 


printf("%d\n", p[i]); 
} 





和 也 就 是 说 ，*(p + i) 和 p[i] 是 一 个 意思 ， 后 者 是 前 者 的 简便 瑟 
在 本 例 中 ， 一 开始 执行 了 p = array; 的 赋值 ， 这 里 的 p 从 最 初 


被 赋值 之 后 就 再 也 没有 改变 。 那 么 ， 不 特地 引入 p 这 样 的 变量 ， 而 直 
接 写成 array， 不 就 行 了 吗 ? 


for (i = 6; i < 5; i++) { 


printf("%d\n", array[i]); 
} 





哎呀 ， 好 像 又 绕 回去 了 。 


因此 ，p[i] 只 是 *(p + i) 的 简便 写法 ， 除 此 以 外 ， 根 本 、 完 
全 、 毫 无 意义 ! 这 在 像 array[i] 这 样 直接 在 数组 名 后 加 上 [] 的 情 
况 下 也 是 一 样 的 。 这 是 由 于 ， 哪 怕 写 成 array[i]，array 也 仍然 会 被 
解读 成 “指向 数组 初始 元 素 的 指针 ” 。 


也 就 是 说 ， 当 你 想 看 “指针 太 难 了， 我 还 是 老 老 实 实地 用 数组 


吧 ”， 并 像 下 面 这 样 声明 数组 ， 然后 通过 array[i] 访问 时 ， 你 就 已 
经 在 使 用 指 针 了 。 


int array[5]; 


这 是 因为 ， 即 使 乍 一 看 只 是 数组 访问 ， 但 其 实在 这 种 情况 下 


array 就 已 经 被 解读 为 指针 ，array[i] 也 已 经 被 解读 为 *(array + 
i) 了 。 


此 外 ，“ 在 表达 去 中 ， 数 组 都 会 被 解读 成 指向 其 初始 元 素 的 指 
针 ” 这 个 规则 有 3 种 例外 情况 ， 我 们 将 在 第 3 章 详细 说 明 。 


虽然 有 些 违背 常理 ， 但 下 标 运算 符 【] 的 确 与 数组 毫 无 关系 ， 至 
少 在 语法 上 是 这 样 的 。 


这 就 是 5 语言 的 数组 下 标 要 从 0 开始 的 原因 之 一 。 


要 扣 

【非常 重要 ! 】 

在 表达 式 中 ， 数 组 都 会 被 解读 成 指向 其 初始 元 素 的 指针 。 
尽管 有 3 种 例外 情况 ， 但 与 数组 名 后 加 不 加 [] 没有 关系 。 


要 点 
p[i] 是 *(p +i) 的 简便 写法 。 
下 标 运算 符 [] 只 有 它 原 本 的 意义 ， 与 数组 之 无 关系 。 





保险 起 见 ， 这 里 申明 一 下 ， 我 们 说 [] 与 数组 毫 无 关系 ， 这 里 的 
[] 只 是 在 表达 式 中 出 现 的 下 标 运算 符 []。 


声明 中 的 [] 还 是 表示 数组 。 前 面 也 提 到 过 ， 声 明 中 的 [] 和 表达 
式 中 的 【] 意思 全 然 人 不同。 表达 式 中 的 * 和 声明 中 的 * 意思 也 完全 不 
同 。 正 因为 如 此 ，C 语言 的 声明 才 变 得 十 分 星 涩 难 懂 。 对 此 ,第 3 章 
将 详细 说 明 。 


另外 ,把 a + b 改写 成 b + a， 其 意义 一 般 是 不 变 的 ， 因 此 *(p 
+ 二 ) 也 可 以 写成 *(i + p)。 而 由 于 p[i] 是 *(p + i) 的 简便 写 
法 ， 所 以 实际 上 也 可 以 把 p[i] 写成 i[p]。 


在 引用 数组 内 容 时 ， 虽 然 通 常 写 成 array[5]， 但 写成 5[array] 
也 可 以 。 但 是 这 种 写法 除了 让 代码 变 得 难以 阅读 以 外 ， 没 有 半点 好 处 。 


要 点 
p[i] 也 可 以 写成 i[p]。 


要 点 
【 比 上 面 的 要 点 更 重要 的 要 扣 】 
但 是 ， 干 万 别 写成 那样 。 





实际 情况 是 ，5 语言 中 的 指针 和 整数 的 类 型 是 不 同 的 ， 因 此 i[p] 
的 写法 容易 导致 编译 时 报错 ， 而 且 我 认为 对 于 这 种 写法 ， 本 来 就 应 该 报 
错 。 因 为 写成 i[p] 这 样 ， 除 了 让 程序 的 可 读 性 变 差 之 外 ， 别 无 他 
用 。 


* 这 种 写法 在 国际 5 语言 乱码 大 赛 (The lnternational 0bfuscated C Code 


Contest，10CCC) 中 或 许可 以 派 上 用 场 。 





在 C 语言 的 FAQ 中 ， 对 于 能 够 使 用 i[p] 这 种 写法 的 特性 ， 有 如 
下 摘 述 。 


这 一 非凡 的 可 兼容 性 ， 在 5 语言 相关 的 文章 中 经 常 被 描述 得 好 
像 很 值得 骄傲 一 样 ， 但 其 实 除了 在 国际 5 语言 乱码 大 赛 中 使 用 之 


外 ， 并 没有 什么 用 处 。 





和 语言 之 所 以 允许 这 种 写法 ， 或 许 是 因为 受到 了 不 区 分 指针 和 整数 
的 B 语言 的 影响 ， 但 无 论 如 何 这 都 不 是 什么 值得 骄傲 的 事情 。 


补充 “语法 糖 


由 于 p[i] 是 *(p + i) 的 简便 写法 ， 所 以 实际 上 就 算 没 有 [] 这 样 
的 运算 符 也 没关系 。 至 少 对 编译 器 来 说 是 这 样 的 。 


然而 ， 对 于 人 类 来 说 ，*(p + i) 这 样 的 写法 既 难以 阅读 ， 写 起 


来 也 (增加 了 打字 量 ) 很 麻烦 。 于 是 〈 仅 仅 ) 为 了 让 人 类 易于 理解 ， 
语言 引入 了 [运算 符 。 


像 这 样 〈 仅 仅 ) 为 了 让 人 类 易于 理解 而 引入 的 功能 ， 的 确 让 我 们 
党 到 了 编程 语言 的 甜蜜 味道 〈 吻 于 着 手 ) ， 因 此 我 们 称 这些 功 能 为 语 
法 糖 (syntax sugar 或 syntactic sugar) 。 





1-4-4 为 何 存 在 指针 运算 这 种 奇怪 功能 


要 访问 数组 内 容 ， 直 接 使 用 下 标 不 就 好 了 ? 为 什么 5 语言 中 还 存 
在 指针 运算 这 样 奇 怪 的 功能 呢 ? 


原因 之 一 是 受到 了 其 祖先 B 语言 的 影响 。 


1-1-1 市 的 补充 内 容 里 也 有 所 提 及 ，B 是 没有 类 型 的 语言 。B 语言 
可 以 使 用 的 类 型 只 有 word 类 型 (总 之 就 是 整数 类 型 )， 指 针 也 是 被 当 
作 整 数 处 理 的 〈 像 浮 点 数 这 样 的 高 级 货 是 没有 的 ) 。 而 且 ， 虽 说 B 语 
言 是 运行 在 虚拟 机 上 的 解释 器 ， 但 这 个 虚拟 机 是 以 word 为 单位 分 配 地 
址 的 《如 1-2-1 节 所 述 ， 如 今 常 见 的 计算 机 都 以 字 节 为 单位 ) 。 


由 于 B 语言 的 地 址 以 word 为 单位 ， 所 以 对 指针 (单纯 表示 地 址 
的 整数 ) 加 1， 指 针 就 会 自动 指向 数组 的 下 一 个 元 素 。 为 了 继承 这 一 
点 ，C 语言 里 引入 了 “对 指针 加 1， 则 指针 前 进 该 指针 所 指向 的 类 型 的 


长 度 ” 这 一 规则 。 


* 对 此 ， 论 文 (或 者 说 是 散文 ) “The Development of the C Language” 里 有 相关 记 


载 ， 可 以 从 丹尼斯 里 奇 的 网 页 获取 。 





p[i] 是 *(p + i) 的 语法 糖 ， 这 一 规则 在 B 语言 里 也 是 一 样 
的 。 不 过 ， 这 里 的 (p + 羡 ) 只 不 过 是 单纯 的 整数 之 间 的 加 法 运算 “。 


”因此 ，B 语言 理所当然 允许 把 p[i] 写成 i[p]。 没 想到 5 语言 竟然 原封 不 动 地 继 
承 了 这 种 规则 〈 真 让 人 无 语 ) 。 





C 语言 中 存在 指针 运算 的 另 一 个 原因 是 ， 以 前 使 用 指针 运算 能 够 写 
高 效 的 程序 。 


我 们 经 常 使 用 数组 循环 来 执行 各 种 处 理 ， 如 下 所 示 。 


for (i = 8; i «< LOOP MAX; i++) { 
米 


* 此 处 使 用 array[i] 进 行 各 种 处 理 


























* array[i] 会 多 次 出 现 
$y 





array[i] 会 在 循环 中 多 次 出 现 ， 2 “array + 
(ix 1 个 元 素 长 度 )” 的 乘法 与 加 法 运算 ， 效 率 当 然 很 低 。 


与 此 相对 ， 在 如 下 所 示 的 使 用 指针 运算 的 程序 里 ， 虽 然 *p 在 循环 
中 多 次 出 现 ， 但 只 需 在 循环 结束 时 执行 1 次 乘法 与 加 法 运算 就 可 以 。 


for (p = &array[6]; p != &array[LOOP MAX]; p++) { 
二 


* 此 处 使 用 *p 进 行 各 种 处 理 
* *p 会 多 次 出 现 
*7 











K&R 中 与 道 : “一 般 来 说 ， 用 指针 的 程序 比 用 数组 下 标 编写 的 程序 
执行 速度 快 。” 见 该 书 5.3 节 ) 可 以 认为 ， 上 面 的 说 明正 是 K&R 中 
如 此 叙述 的 根据 。 


然而 ， 这 些 无 论 怎样 都 是 陈 年 旧事 了 。 


如 今 ， 编 译 器 不 断 优 化 ， 对 于 循环 内 部 重复 出 现 的 表达 式 的 集中 处 
理 是 编译 器 优化 的 基本 内 容 。 以 现在 一 般 的 6 编译 器 来 说 ， 不 论 是 使 
用 数组 还 是 指针 ， 效 率 上 都 不 会 有 太 明 显 的 差异 。 在 大 部 分 情况 下 ， 生 
成 的 机 器 码 是 完全 相同 的 。 


总 的 来 说 ， 可 以 认为 是 早期 的 6 编译 器 在 优化 上 偷工减料 而 导致 
不 得 不 附加 指针 运算 这 一 功能 。 请 回想 一 下 ，C 原本 就 只 是 一 线 开发 人 
员 为 解决 眼前 问题 而 设计 出 来 的 语言 。UNIX 之 前 的 操作 系统 大 多 是 
汇编 器 所 与 的 ， 所 以 即使 可 读 性 有 些 差 ， 人 们 也 不 会 党 得 那 是 什么 大 问 
题 。 另 外 ， 就 当时 的 环境 来 说 ， 追 求 什么 编译 器 优化 实在 有 点 强人 所 


1-4-5 ” 别 再 滥用 指针 运算 了 


前 面 提 到 了 被 誉 为 C 语言 圣经 的 K&R 中 的 表述 : “一 般 来 说 ， 用 
指针 的 程序 比 用 数组 下 标 编写 的 程序 执行 速度 快 。” 这 完全 是 时 代 性 错 
误 。 

然而 ， 如 前 所 述 ， 以 如 今 的 编译 器 来 说 ， 不 论 是 使 用 指针 运算 还 是 
下 标 运 算 ， 生 成 的 都 是 几乎 完全 相同 的 可 执行 代码 。 


既然 如 此 ， 难 道 不 应 该 放弃 指针 运算 “， 老 老实 实地 使 用 下 标 访问 
吗 ? 


人 


明确 地 对 指针 进行 加 减 运 算 的 语 





虽然 K&R 被 许多 人 奉 为 经 典 ， ed 
音 训 的 资料 。 因 为 书 中 的 示例 程序 滥用 指针 运算 的 程度 简直 令 人 衣 溃 。 


乐此不疲 地 写 着 *++argv[6] 这 样 莫 名 其 妙 的 代码 ， 实 在 让 人 心 


烦 。 


K&R 的 5.5 节 中 有 如 下 关于 strcpy() 的 实现 示例 。 


/* strcpy: 把 t 复 制 到 s; 指针 版 3 */ 


void strcpy(char *s, char *t) 





while (*s++ = *t++) 


了 


该 函数 乍 一 看 不 太 容易 理解 ， 但 这 种 写法 是 很 有 好 处 的 ， 我 们 应 
该 掌握 这 种 方法 ，5% 语言 程序 中 经 常会 采用 这 种 写法 。 





既然 知道 “ 千 一 看 不 太 容易 理解 ”， 那 就 不 应 该 这 么 写 ， 不 是 
吗 ? * 


”尤其 是 在 这 段 代 码 中 ， 指 针 在 循环 结束 后 指向 了 空 字 符 的 下 一 个 字符 ， 因 此 如 果 此 


后 要 继续 复制 其 他 字符 串 ， 就 很 容易 诱发 Bug。 





似乎 满 大 街 的 5 语言 入 门 书 都 在 告诉 我 们 ， 与 使 用 下 标的 代码 相 
比 ， 使 用 指针 运算 的 代码 效率 更 高 、 更 有 5 语言 风格 。 


但 是 ， 所 谓 “效率 更 高 ”的 说 法 早已 成 了 约 想 。 再 说， 像 这 种 “ 细 


处 理 。 

所 谓 “ 更 有 5 语言 风格 ” 倒 可 能 是 这 么 回 事 儿 。 但 是 ， 如 果 只 是 
为 了 使 代码 更 有 5 语言 风格 而 让 它 变 得 难以 理解 ， 那 还 是 抛弃 这 种 恶 
习 吧 ， 这 才 算 是 为 世界 和 人 类 谋 幸 福 。 

在 完成 学 校 的 作业 题 时 ， 经 常 遇 到 这 种 情况 : 刚 使 用 下 标 写 完 程 
序 ， 结 果 又 来 一 道 题 要 求 “ 使 用 指针 重 写 上 一 道 题 ”。 


说 实话 ， 这 写 无 意义 。 磁 到 这 种 题 ， 你 可 以 直接 把 使 用 下 标的 程序 
原封 不 动 地 提交 上 去 ， 要 是 遭 到 了 批评 ， 可 以 像 下 面 这 样 顶 回去 。 


号 ? 下 标 运算 符 [] 只 不 过 是 指针 运算 的 语法 糖 而 已 ， 所 以 这 种 


写法 也 是 在 使 用 指针 啊 。 





要 是 又 遭 到 了 批评 ， 那 你 可 以 把 下 标 版 程序 里 的 p[i] 全 部 机 械 地 
蔡 换 成 *(p + i)。 不 过 ， 要 是 因此 而 丢 了 学 分 ， 我 可 概 不 负责 哦 。 


在 C 语言 的 世界 里 ， 人 们 总 会 觉得 使 用 指针 运算 比 使 用 下 标 更 栈 
让 


但 是 ， 与 其 在 这 种 无 所 谓 的 地 方 要 酷 ， 倒 不 如 多 花 点 时 间 去 学 一 些 
有 用 的 知识 ， 毕 竞 作为 一 个 程序 员 ， 还 有 堆积 如 山 的 知识 等 着 你 去 学 习 
呢 。 


话说 回来 ， 任 何 规则 当然 都 有 例外 ， 例 如 在 一 个 庞大 的 char 类 型 
数组 中 ， 硬 是 塞 进 了 各 种 类 型 的 数据 ， 那 么 当 想 要 从 中 取出 第 n 个 字 
节 的 数据 时 ， 使 用 指针 运算 的 代码 ， 其 可 读 性 还 算 比 较 高 。 


不 过 ， 身 为 C 语言 程序 员 ， 如 果 读 不 懂 指 针 运 算 的 代码 ， 那 束 有 
点 不 像 话 了 一 一 现实 就 是 这 么 悲惨 o 


个 管 怎么 说 ， 至 少 从 现在 开始 ， 要 尽量 使 用 下 标 来 写 新 的 程序 。 这 
样 做 不 论 是 对 自己 还 是 对 以 后 阅读 你 写 的 代码 的 人 ， 都 有 好 处 。 


补充 ”更改 参 数 的 做 法 可 取 吗 


刚才 列举 的 K&R 中 的 strcpy() 实现 示例 中 直接 使 用 ++ 修改 
了 形 参 s 和 t。 


的 确 ， 在 5 语言 中 ， 形 参 可 以 与 预先 设 值 的 局 部 变量 一 样 使 
用 ， 所 以 从 语法 上 来 说 ， 修 改 形 参 的 值 没 有 任何 问题 。 但 是 ， 我 从 来 
不 这 么 做 。 

涵 数 的 参数 是 从 调用 方 那里 获得 的 重要 信息 。 如 果 禾 里 糊涂 地 把 


它 改 掉 ， 就 再 也 变 不 回去 了 。 一 旦 修改 了 参数 ， 等 到 以 后 需要 在 其 后 
添加 处 理 ， 或 者 需要 在 调试 时 看 一 下 变量 内 容 时 ， 融 很 难 办 了 。 


此 外 ， 参 数 都 应 该 有 一 个 具有 某 种 意义 的 名 称 〈 从 这 个 角度 来 
说 ， 之 前 的 strcpy() 也 是 个 不 好 的 示例 ) 。 在 多 数 情况 下 ， 修 改 


参数 的 做 法 会 造成 参数 以 违背 其 名 称 意义 的 方式 被 “ 挪 作 他 用 ” 。 


| ”比如 被 用 作 循环 计数 。 


顺便 提 一 下 ，Ada、Eiffel 和 Scala 不 允许 修改 作为 输入 传递 
进来 的 参数 “。 


”不 过 ， 我 认为 它们 内 部 传递 参数 的 方式 应 该 与 5 语言 大 致 相同 。 





1-4-6 试图 将 数组 作为 函数 参数 传递 


这 里 我 们 举 一 个 很 实用 的 例子 ;思考 如 何 使 用 函数 从 英语 的 文本 文 
件 中 将 单词 一 个 一 个 地 读 取出 来 。 


可 以 模仿 fgets()， 将 调用 形式 写成 下 面 这 样 。 

该 函数 以 单词 的 字符 个 数 为 返回 值 ， 当 读 到 文件 末尾 时 返回 EOF。 

子 细 想 来 ， 对 单词 进行 定义 还 真 不 是 一 件 简单 的 事 ， 这 里 索性 就 认 
为 通过 6 语言 的 宏 isalnum() 《ctype. h) 返回 真 的 连续 字符 就 是 单 
词 ， 否 则 就 是 空白 字符 。 


当 单词 长 度 大 于 buf_size 时 ， 处 理 起 来 会 很 麻烦 ， 所 以 在 遇 到 
这 种 情况 时 就 果断 执行 exit()。 


如 代码 清单 1-10 所 示 ， 可 以 配合 使 用 main() 对 该 函数 进行 测 


忒 。 


代码 清单 1-10 get word.c 





1 #include <stdio.h> 
2 #include <ctype.h> 
3 #include <stdlib.h> 








4 
5 int get word(char *buf, int buf size, FILE *fp) 
61{ 
7 int len; 
8 int ch; 
9 
16 /* 跳 过 空白 字符 */ 
11 while ((ch = getc(fp)) != EOF && !isalnum(ch)) 
12 3; 
13 
14 if (ch == EOF) 
15 return EOF; 
16 
17 /* 此 处 ch 里 存放 着 单词 的 首 字 母 */ 
18 len = 0; 
19 do { 


20 buf[len] = ch; 


21 lent+; 


22 if (len >= buf size) { 

23 /* 因 单 词 过 长 而 报错 */ 

24 fprintf(stderr, "word too long.\n"); 
25 exit(1); 

26 } 

27 } while ((ch = getc(fp)) != EOF && isalnum(ch)); 
28 

29 buf[len] = 6 

30 

31 return len; 

32 } 

33 

34 int main(void) 

35 { 

36 char buf[256]; 

37 

38 while (get word(buf, 256, stdin) != EOF) { 
39 printf("<<%s>>\n", buf); 

46 } 

41 

42 return ©; 





main() 中 声明 的 数组 buf 在 get_word() 中 被 填充 了 值 。 


在 main() 中 ，buf 被 作为 参数 传递 ， 但 由 于 函数 的 实 参 在 表达 
式 中 ， 所 以 buf 会 被 解读 成 指向 数组 初始 元 素 的 指针 。 因 此 ， 接 收 
buf 参数 的 get_word() 才 可 以 像 下 面 这 样 以 char * 的 形式 接收 
buf。 


int get word(char *buf, int buf_size，FILE *fp) 


其 次 ， 可 以 在 get_word() 中 像 buf[len] 这 样 操作 buf 的 内 
容 。 这 是 因为 buf[len] 是 *(buf + len) 的 语法 糖 。 


在 get_word() 中 使 用 下 标 运 算 符 访问 buf 的 内 容 ， 会 让 人 觉得 
从 main() 传递 过 来 的 就 是 buf 数组 。 然 而 ， 这 是 个 错觉 ， 从 
main() 传递 过 来 的 说 到 底 只 是 指向 buf 的 初始 元 素 的 指针 〈 请 回想 
一 下 ，1-1-11 节 说 过 6 原本 就 是 只 能 处 理 标量 的 语言 ) 。 


准确 来 说 ， 在 5 语言 中 ， 我 们 无 法 将 数组 作为 函数 参数 来 传递 。 


但 是 可 以 像 上 面 这 样 ， 通 过 传递 指向 初始 元 素 的 指针 来 达到 将 数组 作为 
参数 传递 的 效果 。 


要 点 


如 果 想 要 将 数组 作为 函数 参数 传递 ， 那 就 传递 指向 初始 元 素 的 


针 





不 过 ， 平 时 将 int 等 作为 参数 传递 的 情况 ， 与 本 例 中 将 数组 作为 
参数 传递 的 情况 ， 其 传递 方式 完全 不 同 。 


在 5 语言 中 ， 参 数 全 部 都 是 通过 值 传递 的 ， 传 递 给 函数 的 都 是 它 
的 副本 。 本 例 中 也 一 样 ， 传 递 给 get_word() 的 是 指向 buf 的 初始 元 
素 的 指针 的 副本 。 而 main() 和 get_word() 引用 的 都 是 buf 这 个 
数组 本 身 ， 而 不 是 buf 的 副本 。 正 因为 如 此 ， 我 们 才能 使 用 
get_word() 对 buf 填充 字符 串 并 返回 。 


时 不 时 地 就 会 有 人 据 此 断言 : “在 C 语言 中 ， 数 组 是 通过 引用 传 
递 的 。” 因 此 ， 这 里 我 重申 一 下 ,在 5 语言 中 ， 参 数 全 部 都 是 通过 值 
传递 的 。get_word() 的 示例 只 是 对 指向 数组 buf 的 初始 元 素 的 指针 
进行 了 值 传递 。 


另外 ， 初 学 者 经 常会 有 这 样 的 疑问 : “在 使 用 scanf() 输入 int 
类 型 的 值 时 ， 传 进来 的 变量 名 称 前 需要 加 上 &， 那 为 什么 在 输入 字符 串 
时 不 用 加 & 呢 ? ”在 此 ， 我 也 解答 一 下 这 个 问题 。 在 使 用 scanf() 
输入 字符 串 时 ， 虽 然 传 递 的 是 char 的 数组 ， 但 根据 “数组 在 表达 式 中 
会 被 解读 为 指向 初始 元 素 的 指针 ”这 一 规则 ，char 的 数组 会 变 成 指 
针 ， 而 由 于 这 个 指针 是 通过 值 传递 的 ， 所 以 在 scanf() 中 能 够 实现 向 
调用 源 的 数组 里 填充 结果 的 功能 。 


补充 如 果 对 数组 进行 值 传递 
如 果 出 于 茶 些 原因 ， 你 不 得 不 将 数组 的 副本 作为 参数 进行 传递 ， 





也 不 是 没有 办 法 实现 。 请 将 整个 数组 定义 成 结构 体 的 成 员 。 因 为 正如 
1-1-11 布 中 所 说 ， 哩 然 6 语 言 原本 是 只 能 使 用 标量 的 语言 ， 但 对 于 结 
构 体 ， 则 从 较 早 的 时 期 就 已 经 可 以 进行 集中 处理 了 。 


但 是 ， 我 们 还 是 要 知道 ， 该 方法 在 效率 上 是 有 问题 的 。 当 数组 很 


庞大 时 ， 一 点 一 点 地 获取 副本 可 能 会 拖 慢 程序 。 


顺便 说 一 下 ， 我 曾经 在 思考 黑白 棋 的 行 棋 思 路 时 ， 使 用 该 方法 对 
表示 棋局 的 二 维 数组 进行 了 值 传递 。 在 这 类 游戏 的 行 棋 思 路 里 ， 需 要 
通过 对 “在 这 里 这 样 下 的 话 会 变 成 这 样 ”这 种 巨大 的 树 形 结构 进行 递 
归 查找 ， 从 而 得 出 最 佳 棋 招 ， 所 以 每 下 一 步 棋 ， 都 需要 生成 棋局 的 副 
本 。 我 感觉 ， 也 就 只 有 在 这 种 情况 下 才 需 要 使 用 这 种 技术 。 





1-4-7 ”声明 函数 形 参 的 万 法 
如 下 所 示 ， 本 书 的 示例 程序 中 将 get_word() 的 参数 buf 定义 为 


char *。 

int get word(char *buf, int buf_size, FILE *fp) 
可 能 有 人 会 说 : “号 ? 我 可 一 直 都 是 像 下 面 这 样 写 的 呀 。” 

int get word(char buf[], int buf size, FILE rp | 
只 有 在 声明 水 数 形 参 时 ， 才 可 以 将 数组 的 声明 解读 为 指针 。 
比如 ， 编 译 器 会 特别 地 把 


int func(int a[]) 


int func(int *a) 


即使 像 下 面 这 样 写 上 元 素 个 数 ， 编 译 器 也 会 无 视 。 


int func(int a[16]) 
这 也 是 一 种 语法 糖 。 


要 注意 的 是 ， 在 5 语言 的 语法 中 ， 只 有 在 这 种 情况 下 int a[] 
和 int *a 才 具 有 相同 的 意义 。 对 此 ， 第 3 章 将 详细 说 明 。 


要 点 
以 下 形 参 声明 全 部 都 是 同一 个 意思 。 


int func(int *a) /* 模式 1 */ 
int func(int a[]) /* 模式 2 */ 
int func(int a[16]) /* 模式 3 */ 


模式 2 与 模式 3 是 模式 1 的 语法 糖 。 


补充 C0 语言 为 什么 不 进行 数组 边 责 检查 


通常 ，C 语言 没有 数组 边界 检查 的 功能 。 拜 这 一 点 所 赐 ， 当 对 超 
出 下 标 范围 的 内 存 执行 写 入 操作 时 ， 会 发 生 内 存 损坏 这 一 糟糕 现 象 。 
要 是 操作 系统 在 程序 执行 早期 就 发 现 异 常 并 报 出 了 “Segmentat ion 
fault” (〈 段 错误 ) 或 “xx. exe 已 停止 工作 ”之 类 的 消息 ， 那 还 算是 
比较 幸运 。 要 是 运气 不 好 ， 程 序 中 相 邻 变量 的 内 容 遭 到 了 破坏 但 程序 
仍然 不 自 知 还 继续 运行 ， 直 到 很 久之 后 才 在 程序 深 处 发 生 错 误 ， 那 就 
会 造成 巨大 影响 。 


有 些 人 觉得 老 是 执行 边 家 检查 会 影响 效率 ， 所 以 不 愿意 去 检查 ， 
那 至 少 也 应 该 在 编译 时 给 个 选项 ， 让 编译 器 在 调试 模式 下 进行 编译 时 
实施 数组 边 宪 检查 。 会 这 样 想 的 应 该 不 止 我 一 个 。 





但 是 ， 请 稍微 再 想 一 想 这 个 问题 。 


如 果 是 像 int a[16]; 这 样 声明 数组 ， 并 通过 a[i] 引用 它 的 
内 容 的 编程 语言 ， 可 以 很 轻松 地 进行 边 弄 检查。 但 是 ,在 5 语言 
中 ， 表 达 式 中 的 数组 会 立刻 被 解读 成 指针 。 男 外 ， 还 可 以 使 用 其 他 指 
2 ee 并 且 可 以 随意 地 对 这 个 指针 变量 进行 
0 减 运算 。 


虽然 在 引用 数组 内 容 时 ， 可 以 使 用 a[i] 的 写法 ， 但 这 只 不 过 
是 *(a + i) 的 语法 糖 而 已 。 


男 外 ， 在 向 其 他 函数 传递 数组 时 ， 实 际 上 传递 的 是 一 个 指向 初始 


元 素 的 指针 ， 但 此 时 数组 长 度 不 会 被 自动 传递 过 去 。 前 面 提 到 的 
get_word() 使 用 了 buf_size 参数 来 传递 buf 的 长 度 ， 但 这 之 间 
的 关系 只 有 写 的 人 知道 ， 编 译 咒 是 不 知道 的 。 


与 其 他 语言 相 比 ， 这 样 的 语言 在 编译 时 生成 数组 边 责 检查 的 代码 
的 难度 不 是 一 般 大 。 


如 果 无 论 如 何 都 想 要 进行 边 表 检查， 可 以 考虑 将 指针 封装 成 结构 
体 ， 使 得 指针 本 身 在 运行 时 能 够 获得 自己 的 可 取 值 范围 。 但 是 ， 这 种 
做 法 对 运行 性 能 会 有 很 大 影响 ， 而 且 会 形 失 在 非 调 试 模 式 下 编译 的 库 
与 指针 的 兼容 性 。 


总 的 来 说 ， 在 现 阶段 实际 可 供 使 用 的 编译 器 中 ， 几 乎 没有 能 够 进 
行 数 组 边 珊 检 查 的 。 不 过 ， 如 果 是 解释 器 的 运行 环境 ， 似 乎 可 以 进行 
数组 边 寞 检查 。 





1-4-8 099 中 的 可 变 长 数组 


长 期 以 来 ， 说 到 5 语言 的 数组 ， 人 们 就 会 想到 它 的 长 度 是 固定 
的 ， 除 非 使 用 malloc() 动态 分 配 内 存 ， 否 则 就 需要 在 源 文件 里 直接 
ee 例如 ， 在 如 下 所 示 的 数组 声明 中 ， 声 明 的 是 固定 长 度 为 
10 的 数组 。 


int array[16]; 


从 1S0 099 开始 ， 对 于 自动 变量 ( 非 static 的 局 部 变量 ) ， 我 
们 可 以 在 上 面 代 码 中 “10” 的 地 方 写 入 变量 ， 这 称 为 可 变 长 数组 
(Variable Length Array，VLA) 。 另 外 ， 从 前 0 语言 常常 把 使 用 
malloc() 分 配 可 变 长 内 存 空间 的 技术 叫 作 “可 变 长 数组 ”*， 为 避免 
混 消 ， 本 书 把 C99 中 的 可 变 长 数组 称 为 VLA， 把 使 用 malloc() 分 配 
的 数组 称 为 动态 数组 〈 见 第 2 章 和 第 4 章 ) 。 


”这 并 不 是 标准 中 正式 规定 的 名 称 。 





代码 清单 1-11 融 是 一 个 VLA 的 示例 。 


代码 清单 1-11 vla.c 

















1 #include “stdio.h> 

2 

3 int main(void) 

44 

5 int size1l, size2, size3; 

6 

7 printf(" 请 输入 3 个 整数 值 \n"); 

8 scanf("%d%d%d", &size1l, &size2, &size3); 
9 
16 // 可 变 长 数组 的 声明 
11 int array1[size1]; 
12 int array2[size2][size3]; 
13 
14 // 对 可 变 长 数组 进行 适当 的 赋值 
15 int i; 
16 for (i = 6;j i «< sizel; i++) { 
17 array1[I] = i; 
18 } 
19 int j; 
20 for (i = 68; i «< size2; i++) { 
21 for (j = 6;j j < size3; j++) { 


22 array2[i][j] = i * size3 + j; 





24 } 

25 

26 // 输出 所 赋 的 值 

27 for (i = 6;j i «< sizel; i++) { 

28 printf("array1[%d]..%d\n", i, array1[i]); 

29 } 

36 for (i = 6;j i «< size2; i++) { 

31 for (j = 6;j j < size3; j++) { 

32 printf("\t%d", array2[i][j]); 

33 } 

34 printf("\n"); 

35 } 

36 printf("sizeof(array1)..%zd\n", sizeof(array1)); 
37 printf("sizeof(array2)..%zd\n", sizeof(array2)); 





| 人 可 以 看 到 ， 程 序 根据 用 户 从 键盘 输入 的 数值 生 
了 数组 。 


请 输入 3 个 整数 值 
3 4 5 从 键盘 
array1[6].. 
| 
array1[2]..2 





5 

10 

15 
sizeof(array1).. 
sizeof(array2).. 





代码 清单 1-11 的 第 8 行 通过 scanf() 输入 了 3 个 值 ， 并 以 
第 1 个 值 为 长 度 声明 了 一 维 数 组 array1， 使 用 第 2 个 和 第 3 个 值 
声明 了 二 维 数组 array2 (第 11 行 ` 第 12 行 ) 。 这 种 在 非 函数 开头 
位 置 声 明 变 量 的 写法 也 是 099 的 新 功能 。 


* 关于 scanf()， 请 同时 参考 2-1 节 的 补充 内 容 。 





在 对 该 数组 输入 适当 的 数值 后 ， 程 序 输 出 了 相应 的 结果 。 第 10 
行 、 第 14 行 和 第 26 行 中 “以 // 开头 的 注释 ”也 是 099 的 新 功 


人 已 
月 c 。 


第 36 行 " 第 37 行使 用 sizeof 运算 符 输出 了 array1、array2 
的 长 度 。 由 此 可 见 ， 数 组 长 度 是 由 运行 时 从 键盘 输入 的 数值 决定 的 〈 在 
我 的 环境 中 ，int 是 4 字 节 ) 。 


一 直到 ANSI1 C 为 止 ，sizeof 运算 符 的 返回 值 都 是 在 编译 时 决定 
的 ， 而 在 1S0 C99 中 ， 我 们 可 以 像 这 样 在 运行 时 决定 。 


“ 太 好 了 ! 厉害 ! 完美 ! 超 方便 ! ” 你 一 定 是 这 么 想 的 吧 ? 


但 说 到 底 ，VLA 目前 还 是 只 能 用 于 非 static 的 局 部 变量 ， 对 于 
全 局 变量 是 不 可 用 的 ， 而 且 也 无 法 利用 VLA 使 结构 体 的 成 员 可 变 长 ”。 
虽然 这 样 看 来 ，VLA 的 可 用 场景 似乎 十 分 有 限 ， 但 尽管 如 此 ， 在 很 多 情 
况 下 还 是 有 它 比 较 方 便 。 不 过 ， 遗 憾 的 是 ， 在 C11 中 VLA 被 降格 为 可 
选 功能 。 人 _STDC_NO_VLA_， 在 该 运行 环境 中 就 无 法 使 
用 VLA 功能 





”099 中 添加 了 使 结构 体 可 以 包含 可 变 长 成 员 的 功能 ， 即 柔性 数组 成 员 ， 但 这 与 VLA 


是 不 同 的 功能 。 





‖ 第 2 章 


做 个 实验 一 一 C 语言 是 怎样 使 用 内 存 的 


2-1 ”虚拟 地 址 | 


关于 内 存 与 地 址 ， 我 们 在 1-2 布 中 进行 了 如 下 说 明 : 


为 了 对 内 存 进行 读 写 ， 必 须 指定 要 访问 的 是 庞大 的 内 存 空间 里 的 
哪个 位 置 ， 这 时 使 用 的 数值 就 是 地 址 (address)〉 。 现 在 仅 考 虑 以 下 


情 锅 : 内 存 中 的 每 个 字 节 都 有 一 个 地 址 ， 地 址 编号 从 0 开始 顺序 递 


日 o 





之 所 以 说 “现在 仅 考 虑 ”， 是 因为 真实 情况 并 非 如 此 。 事 实 上 ， 如 
今 的 计算 机 通常 没有 这 么 简单 。 


现在 计算 机 等 的 操作 系统 都 提供 了 多 任务 环境 ， 可 以 同时 运行 多 个 
程序 进程) 。 

那么 ， 假 如 通过 两 个 同时 运行 的 程序 输出 它们 各 自 的 变量 地 址 ， 这 
些 地 址 有 可 能 是 一 样 的 吗 ? 如 果 物 理 内 存 中 的 地 址 从 0 开始 顺序 递 
增 ， 而 且 通 过 & 运算 符 获 取 该 地 址 ， 那 么 这 种 情况 应 该 不 会 发 生 。 


下 面 我 们 做 一 个 实验 。 首 先 ， 请 将 代码 清单 2-1 编译 为 可 执行 文 


这 里 将 可 执行 程序 命名 为 vmtest。 


代码 清单 2-1 vmtest.c 


#include <stdio.h> 
int hoge; 


int main(void) 
{ 
char buf[256]; 


printf("&hoge...%p\n", (void*)&hoge); 


printf("Input initial value.\n"); 
fgets(buf, sizeof(buf), stdin); 
sscanf(buf, "%d", &hoge); 


for (;;) { 
printf("hoge..%d\n", hoge); 
/* 
* 使 用 getchar() 进 入 等 待 输入 的 状态 
* 每 敲 击 一 次 回 车 键 ，hoge 的 值 都 会 增加 
*/ 
getchar() ; 
hoge++; 
































} 


return 0; 





如 今 的 运行 环境 大 多 提供 了 多 窗口 环境 ， 所 以 请 新 开 两 个 终端 应 用 
(在 Windows 上 可 以 用 命令 行 窗口 或 PowerShe11) 。 如 果 此 时 这 两 个 
窗口 没有 以 完全 相同 的 方式 局 动 ， 那 么 后 面 的 实验 可 能 无 法 顺利 进行 。 
在 使 用 Windows 的 情况 下 ， 可 以 两 个 窗口 都 从 开始 菜单 局 动 。 


然后 ， 请 在 这 两 个 窗口 中 必要 时 可 先 通 过 cd 命令 进入 可 执行 程 
序 所 在 目录 ) 运行 刚才 的 程序 。 


在 我 的 环境 中 ， 运 行 结 果 如 图 2-1 所 示 。 


kmaebashi@kmaebashi-VirtualBox:~$ emacs& 

[1] 15589 

kmaebashi@kmaebashi-VirtualBox:~$ cd doc/pointer2/src/chapo2 
kmaebashi@kmaebashi-VirtualBox:~/doc/pointer2/src/chapd2$ , /vmtest 
&hoge, . .0x60106c 

Input initial value, 


kmaebashi@kmaebashi-VirtualBox: ~/doc/pointer2/src/chap02 


kmaebashi@kmaebashi-VirtualBox:~$ cd doc/pointer2/src/chapo2 
kmaebashi@kmaebashi-VirtualBox:~/doc/pointer2/src/chapQ2$ /vmtest 


&hoge, . .0x60106cC 
Input initial value, 
20 

hoge. ,20 

hoge, .21 

hoge. ,22 


hoge, ,23 





图 2-1 通过 两 个 进程 同时 输出 变量 地 址 


第 9 行使 用 printf() 输出 了 全 局 变量 hoge 的 地 址 。 然 后 ， 通 
过 第 12 行 的 fgets()， 程序 进入 了 等 待 输入 的 停止 状态 ， 所 以 在 刚 
局 动 后 的 这 段 时 间 中 ， 两 个 窗口 中 启动 的 程序 肯定 都 处 于 运行 中 的 状 
态 。 可 是 ，hoge 的 地 址 却 完全 相同 。 


从 (5 语言 程序 来 看 ， 这 两 个 程序 里 的 hoge 具有 完全 相同 的 地 
址 ， 但 它们 却 是 不 同 的 两 个 变量 。 请 根据 Input initial value. 提 
示 符 ， 输 入 适当 的 值 。 该 值 将 被 赋 给 om (第 13 行 ) ， 然 后 通过 第 
16 行 的 printf() 输出 。 随 后 ， 程 序 通过 getchar() 进入 等 待 输入 
状态 ， 每 右 一 次 回 车 键 ，hoge 的 值 都 会 增加 并 输出 。 通 过 这 个 运行 示 
0 这 两 个 hoge 明明 具有 完全 相同 的 地 址 ， 却 能 够 分 别 持 有 


我 在 Windows 10 和 VirtualBox 上 的 Ubuntu Linux 中 进行 了 该 
实验 ， 在 两 种 环境 下 都 得 到 了 这 样 的 结果 〈 编 译 器 是 gcc) 。 


从 这 个 实验 可 以 看 出 ， 在 如 今 的 运行 环境 中 ， 通 过 printf() 输 
出 的 指针 值 ， 并 非 物理 内 存 的 地 址 本 身 。 


如 今 的 计算 机 等 的 运行 环境 ”对 于 应 用 程序 的 每 个 进程 都 会 分 配 独 
立 的 虚拟 地 址 空间 。 这 与 C 语言 无 关 ， 而 是 操作 系统 和 CPU 协同 工作 
的 结果 。 正 是 由 于 操作 系统 和 CPU 努力 地 给 每 个 进程 (程序 ) 分 配 独 
立 的 地 址 空间 ， 所 以 就 算 我 这 样 粗 枝 大 时 的 程序 员 一 不 小 心 搞 出 Bug， 
误 写 了 不 该 写 的 内 存 区 域 ， 顶 多 也 就 是 让 当前 进程 月 溃 ， 而 不 会 影响 其 


他 进程 。 


”小 型 嵌入 式 系统 就 又 是 另外 一 回 事 了 。 





当然 ， 要 想 实 际 存 储 数据 ， 还 得 仰 仗 物理 内 存 。 负 责 将 物理 内 存 分 
配给 虚拟 地 址 空间 的 是 操作 系统 。 


操作 系统 也 会 对 每 块 内 存 区 域 设置 “只 读 ” 或 者 “可 读 写 ”等 属 
性 ， 表 示 “ 这 块 区域 是 只 读 的 ”或 者 “这 块 区域 是 可 读 写 的 ”。 


程序 的 执行 代码 等 通常 是 禁止 写 入 的 ， 所 以 有 时 需要 与 其 他 进程 共 
享 物理 内 存 "。 另 外 ， 当 运行 多 个 大 型 程序 而 导致 物理 内 存 不 足 时 ， 操 
作 系 统 会 将 物理 内 存 中 当前 未 被 引用 的 部 分 撤 至 硬盘 ， 以 腾 出 空间 “这 
称 为 内 存 交 换 ) 。 当 程序 需要 再 次 引用 该 内 存 空间 时 ，【〈 鸡 怕 又 需要 把 
别 的 部 分 撤 至 硬盘 ) 再 把 它 从 硬盘 写 回 到 内 存 。 这 一 切 工作 全 都 是 由 操 
作 系 统 在 幕后 完成 的 ， 应 用 程序 对 背后 的 这 些 操 作 一 无 所 知 。 不 过 ， 你 
会 听 到 硬盘 味 味 作 啊 ， 运 行 速度 也 会 变 得 非常 缓慢 。 


”现在 通常 使 用 共享 库 这 一 手法 来 共享 程序 的 一 部 分 。 在 写 入 之 前 ， 连 数据 内 存 空间 


都 可 以 共享 。 





之 所 以 能 够 这 样 ， 还 是 多 亏 了 虚拟 地 址 。 正 是 由 于 应 用 程序 不 直接 
面 对 物 理 内 存 地 址 ， 操 作 系统 才 可 以 任意 地 对 内 存 空间 进行 再 分 配 图 


2-2) o 






禁止 写 入 的 内 存 空间 
可 能 会 被 共享 


ey 


当 内 存 不 足 时 可 能 会 
被 移 至 硬盘 





图 2-2 虚拟 内 存 的 概念 图 
要 点 
在 如 今 的 运行 环境 中 ， 应 用 程序 面 对 的 是 虚拟 地 址 空间 。 


补充 “关于 scanf () 
在 代码 清单 2-1 中 ， 为 了 让 用 户 输 入 整数 值 ， 我 们 使 用 了 下 面 的 





两 步 式 处 理 。 


fgets(buf, sizeof(buf), stdin); 





sscanf (buf, "%d", &hoge); 
但 在 一 般 的 0 语言 入 门 书 中 ， 多 数 采用 的 是 下 面 这 种 方式 。 
不 过 ， 在 代码 清单 2-1 中 ， 如 果 使 用 这 种 写法 ， 程 序 是 无 法 如 期 
0 恐怕 最 初 的 那个 getchar() 到 不 了 等 待 输入 的 状态 就 退出 
这 个 问题 是 由 scanf() 的 设计 造成 的 。 


scanf() 不 是 以 行为 单位 来 解读 输入 数据 ， 而 是 以 连续 输入 字 
符 的 流 来 解读 〈 换 行 符 也 视 为 一 个 字符 ) 。 


scanf() 从 流 中 逐一 读 取 字符 ， 对 与 转 义 字符 〈%d 等 ) 匹配 的 
部 分 进行 转换 。 


假设 当 转 义 字符 为 %d 时 ， 输 入 如 下 所 示 。 

那么 ，scanf() 会 从 流 中 读 取 “ 到 123 为 止 的 数据 ”， 其 中 的 
换行 符 会 残留 在 流 中 。 因 此 ， 后 续 的 getchar() 就 会 读 取 到 这 个 
被 剩 下 的 换行 符 。 


另外 ， 当 scanf() 转换 失败 时 〈 比 如 ， 指 定 了 %d， 输 入 的 却 
是 英文 字符 等 ) ，scanf() 会 把 那 部 分 数据 遗留 在 流 中 。 


scanf() 的 返回 值 是 成 功 赋值 的 数据 项 数 。 当 想 要 认真 进行 错 
误 检查 而 写 出 了 如 下 程序 时 ， 


while (scanf("%d", &hoge) != 1) { 





printf(" 输 入 错误 。 请 再 次 输入 。"); 


} 





只 要 用 户 有 一 次 输入 失误 ， 该 程序 就 会 陷入 无 限 循环 。 因 为 错误 
输入 的 字符 串 会 被 后 续 的 scanf() 再 次 读 取 。 


像 代 码 清单 2-1 那样 将 fgets() 和 sscanf() 组 合 使 用 ， 
(基本 ) 可 以 避免 此 类 问题 。 


当然 ，fgets() 也 一 样 ， 一 旦 输入 的 字符 串 长 度 大 于 第 2 个 参 
数 所 指定 的 长 度 ， 多 余部 分 就 会 残留 在 流 中 。 但 由 于 本 程序 是 自己 使 
用 的 示例 程序 ， 所 以 这 方面 就 容 我 偷 个 懒 吧 。 

顺便 说 一 下 ， 虽 然 也 可 以 通过 在 scanf() 中 指定 复杂 的 转 义 字 


符 来 避免 这 类 问题 ， 但 我 还 是 党 得 组 合 使 用 fgets() 的 方式 处 理 起 
来 更 轻松 一 些 。 


另外 ， 为 了 解决 这 个 问题 ， 有 人 会 使 用 “fflush(stdin);”， 
但 这 个 处 理 方法 其 实 是 错误 的 。 


fflush() 是 用 于 输出 流 的 ， 不 能 用 于 输入 流 。 在 5 语言 标准 
中 ，fflush() 用 于 输入 流 的 行为 是 未 定义 的 。 


补充 未 定义 、 示 指定、 实现 定义 
上 面 一 段 提 到 “fflush( ) 用 于 输入 流 的 行为 是 未 定义 的 ”。 


对 于 未 定义 行为 (undefined behavior) ，C 语 言 标准 是 这 样 描 
述 的 : 关于 使 用 没有 可 移植 性 或 者 不 正确 的 程序 组 成 元 素 时 的 行为 ， 
或 者 使 用 不 正确 的 数据 时 的 行为 ， 本 标准 无 任何 强制 要 求 。 也 就 是 
说 ， 要 是 执行 了 标准 中 “未 定义 ”的 代码 ， 那 么 一 切 后 果 都 请 自负 。 
人 们 常常 将 这 种 情况 戏称 为 “即使 魔鬼 从 你 的 和 描 子 里 跳出 来 也 与 标准 
不 矛盾 ”*。 


”这 是 在 comp. std. c 和 comp. lang.c 上 流传 的 关于 执行 未 定义 代码 的 后 果 的 一 
个 玩笑 话 一 一 译 者 注 。 





类 似 的 说 法 有 未 指定 行为 〈unspecified behavior) ， 对 此 标准 
中 的 描述 是 : 本 标准 会 提供 两 种 以 上 的 可 能 性 ， 关 于 不 同 场合 下 选择 
哪 种 可 能 性 不 做 强制 要 求 。 例 如 ， 函 数 参 数 的 评估 顺序 是 未 指定 的 ， 


因此 对 于 表达 式 hoge(func1()，func2())，func1() 与 func2() 到 
底 哪 个 先 被 调用 是 未 知 的 。 不 过 ， 虽 说 顺序 是 未 知 的 ， 但 func1( ) 和 
func2() 的 调用 代码 还 是 可 以 正常 生成 的 。 


另外 ， 实 现 定义 行为 (implementation-defined behavior) 是 
指 各 实现 方式 对 从 未 指定 行为 中 选 定 的 行为 进行 文档 化 。 例 如 char 
是 否 带 符号 是 由 实现 方式 定义 的 。 实 现 方 式 可 以 任 选 其 一 ， 但 必须 将 
选择 结果 文档 化 。 





2-2 6 语言 中 内 存 的 使 用 方法 | 


2-2-1 0C 语言 中 变量 的 种 类 


C 语言 的 变量 可 以 基于 作用 域 (scope) ”和 存储 期 (storage 
duration) 这 两 个 维度 进行 分 类 。 


* 在 标准 中 ， 作 用 域 (scope) 和 链接 〈1inkage) 是 分 别 定义 的 ， 包 含 在 代码 块 内 的 
是 作用 域 ， 而 链接 则 由 static 和 extern 控制 。 
通常 所 说 的 全 局 变量 ， 其 作用 域 是 文件 作用 域 (fi le scope) ， 链 接 是 外 部 链接 (external 


| inkage) 。 
无 论 是 作用 域 还 是 链接 ， 都 是 对 命名 空间 的 控制 ， 因 此 本 书 中 将 它们 统一 
泵 头 [1 用 或 ” 。 





在 编写 小 型 程序 时 ， 我 们 可 能 对 作用 域 的 必要 性 没什么 感觉 。 但 
是 ， 对 于 几 万 行 甚至 几 十 万 行 的 程序 来 说 ， 作 用 域 一 定 是 不 可 或 缺 的 。 
作用 域 限 定 了 变量 的 有 效 范 围 ， 使 得 我 们 可 以 不 必 在 意 是 否 会 发 生 名 称 
冲突 ， 也 不 必 在 意 是 否 会 改写 不 相干 的 变量 内 容 (在 C 语言 中 ， 可 能 
存在 原本 不 可 见 的 变量 由 于 内 存 损坏 或 者 通过 指针 进行 了 写 入 操作 而 遭 


到 改写 的 情况 )。 


)1. 


C 语言 中 变量 的 作用 域 有 如 下 几 种 。 
全 局 变量 
在 函数 外 部 定义 的 变量 默认 成 为 全 局 变量 。 


全 局 变量 对 程序 的 任何 地 方 都 是 可 见 的 。 当 程 序 被 分 割 为 多 个 
源 文件 进行 编译 时 ， 只 要 声明 了 全 局 变量 ， 束 可 以 从 其 他 源 文 件 引 
用 它 。 


文件 内 的 static 变量 


即便 是 像 全 局 变量 那样 在 函数 外 部 定义 的 变量 ， 一 旦 加 上 
static， 其 作用 域 就 只 限定 在 当前 源 文件 内 。 指 定 为 static 的 
变量 〈 通 数 ) 对 于 其 他 源 文件 是 不 可 见 的 《函数 也 是 一 样 的 ) 。 


英语 static 的 意思 是 “静态 的 ”。 在 后 面 讲 到 存储 期 的 控制 
时 ， 我 们 也 会 用 到 这 个 单词 。 但 是 ，“ 将 作用 域 限制 在 文件 内 ”这 
个 看 起 来 完全 不 相干 的 功能 却 被 冠 以 “static”， 从 这 一 点 也 可 以 
看 出 5 语言 有 多 么 随意 。 


局 部 变量 


在 函数 中 声明 的 变量 融 是 局 部 变量 。 局 部 变量 只 能 在 其 
在 的 代码 块 〈 用 {} 括 起 来 的 范围 ) 中 被 引用 。 


局 部 变量 通 单 在 函数 开头 进行 声明 ， 但 也 可 以 在 函数 内 部 的 代 
码 块 的 开头 进行 声明 。 由 于 作用 域 只 限定 在 该 代码 块 内 ， 所 以 在 需 
要 使 用 一 下 临时 变量 以 交换 两 个 变量 的 内 容 的 情况 下 ， 将 局 部 变量 
的 声明 放 在 当前 代码 块 开 头 还 是 比较 方便 的 。 另 外 ， 从 C99 开 
始 ， 我 们 就 已 经 可 以 像 Ct+、Java 和 c# 那样 ， 在 代码 块 的 中 间 


位 置 声 明 局 部 变量 了 。 


局 部 变量 在 离开 相应 代码 块 时 就 被 释放 了 。 如 果 不 想 释放 〈 希 
望 再 次 进入 该 代码 块 时 它 能 保持 相同 的 值 )， 在 声明 时 加 上 


荆 
对 


static 即 可 《〈 详 见 后 文 ) 。 
接 下 来 ， 我 们 看 一 下 存储 期 。C 语言 中 有 以 下 两 种 存储 期 。 
)1. 静态 存储 期 (static storage duration) 


ee 文件 内 的 static 变量 以 及 市 static 限定 的 局 
量 都 具有 静态 存储 期 ， 这 些 变量 有 时 也 被 统称 为 静态 变量 。 


具有 静态 存储 期 的 变量 拥有 从 程序 开始 到 结束 为 止 的 生命 周 
期 。 换 言 之 ， 它 一 直 存 在 于 内 存 的 同一 地 址 上 。 


)2. 自动 存储 期 (auto storage duration) 


不 带 static 限定 的 局 部 变量 具有 自动 存储 期 ， 这 样 的 变量 
被 称 为 自动 变量 


具有 自动 存储 期 的 变量 ， 在 程序 进入 其 所 在 代码 块 时 被 分 配 内 
存 空间 ， 在 程序 离开 该 代码 块 时 内 存 空 间 被 释放 。 这 通常 是 使 用 
栈 的 机 制 实现 的 ， 详 细 内 容 请 参考 2-5 节 。 


”在 具体 实现 上 ， 我 觉得 许多 运行 环境 并 不 是 在 “程序 进入 代码 块 时 ”给 自动 


变量 分 配 内 存 空间 的 ， 而 是 在 “程序 进入 函数 时 ”统一 进行 内 存 分 配 的 。 





此 外 , 在 5 语言 中 ， 也 可 以 使 用 malloc() 函数 动态 分 配 内 存 。 
这 样 分 配 的 内 存 具 有 直到 被 free() 〈 释 放 ) 为 止 的 生命 周期 。 


需要 在 程序 中 保持 荣 些 数据 时 ， 必 须 在 内 存 中 的 某 个 地 方 获取 相 
上 的 内 个 空间 。 总 的 来 说 ， 在 5 语言 中 ， 内 存 空间 的 生命 周期 有 以 下 
几 玫 


生命 周期 从 程序 运行 时 开始 ， 到 程序 关闭 时 结束 。 


)2. 自动 变量 
命 周 期 直至 程序 离开 该 变量 声明 所 在 的 代码 块 为 止 。 


)3. 通过 malloc () 分 配 的 内 存 空间 
生命 周期 直至 free() 被 调用 为 止 。 


要 扣 
在 5 语言 中 ， 内 存 空间 的 生命 周期 有 以 下 3 种 。 


静态 变量 ; 生命 周期 从 程序 运行 时 开始 ， 到 程序 关闭 时 结束 。 
自动 变量 : 生命 周期 直至 程序 离开 该 变量 声明 所 在 的 代码 块 为 
Tes 

pe malloc() 分 配 的 内 存 空间 : 生命 周期 直至 free() 被 调 
用 为 止 。 


补充 存储 类 说 明 符 


0 语言 的 语法 将 以 下 关键 字 定 义 为 存储 类 说 明 符 : 


typedef extern static auto register 


然而 ， 在 这 些 存 储 类 说 明 符 中 ， 真 正 用 于 指定 变量 存储 期 的 ， 其 
实 只 有 static*。 


”而 且 ， 假 如 static 被 用 在 函数 外 部 ， 则 它 所 控制 的 也 并 非 是 存储 期 ， 而 是 作 





extern 是 “使 在 别处 定义 的 外 部 变量 在 此 处 也 可 见 ” 的 意思 ， 


而 auto 本 来 就 是 默认 的 ， 因 此 无 须 指 定 。register 用 于 给 编译 器 提 
供 优 化 提示 。 虽 然 加 上 该 说 明 符 的 变量 会 被 优先 分 配给 寄存 咒 (因此 
就 无 法 使 用 & 运 算 符 了 ) ， 但 最 近 的 编译 器 实现 都 已 经 很 到 位 了 ， 
般 用 不 到 这 个 说 明 符 。 宇 守 Lybeder. 它 所 定义 的 根本 就 不 是 当量 
是 类 型 名 称 ， 只 是 由 于 可 以 给 编码 帝 来 便利 才 被 归 入 存储 类 说 明 符 


请 大 家 不 要 被 这 一 大 堆 存储 类 说 明 符 乱 了 阵脚 





2-2-2 ”尝试 输出 地 址 


如 前 所 述 ，C 语言 的 变量 具有 若干 阶段 的 作用 域 ， 而 且 变 量 之 间 还 
有 存储 期 的 区 别 。 另 外 ， 我 们 也 可 以 通过 malloc() 动态 分 配 内 存 。 


这 些 变量 在 内 存 中 到 底 是 如 何 配置 的 呢 ? 我 们 写 一 个 测试 程序 来 验 
一 下 《代码 清单 2-2) 。 


【注意 ! 】 
实际 上 代码 清单 2-2《〈“ 也 ? ) 并 没有 严格 遵守 5 语言 标准 。 


正如 我 们 后 面 会 讲 到 的 ， 第 28 行 和 第 29 行 通 过 printf() 
输出 了 指向 函数 的 指针 ， 为 此 这 里 将 指针 的 类 型 转换 成 了 void*。 
但 是 ， 指 向 函数 的 指针 与 指向 int 或 指向 char 的 指针 不 同 ， 是 不 
能 转换 成 void* 的 。 实 际 上 ， 在 gcc 中 ， 加 上 用 来 关闭 gcc 扩展 
功能 的 选项 -pedantic 之 后 ， 此 处 的 类 型 转换 会 报 出 以 下 警告 。 


warning: ISO C forbids conversion of function pointer to object pointer 


虽然 printf() 中 的 转 义 字符 %p 是 支持 void* 的 , 但 (无 
论 是 099 还 是 C11) 没有 一 个 转 义 字符 可 以 输出 指向 函数 的 指针 。 
因此 ， 现 在 的 情况 就 是 ， 不 存在 可 以 通过 printf() 输出 指向 函数 





的 指针 的 “正确 ”方法 。 


但 是 ， 由 于 在 大 多 数 运 行 环境 中 ， 即 便 报 出 警告 ， 程 序 也 能 正常 
运行 ， 所 以 这 里 没有 严格 遵守 标准 ， 而 是 实际 输出 了 地 址 ， 以 便 大 


家 “实际 感受 ”变量 在 内 存 上 的 配置 。 


代码 清单 2-2 print address. c 








1 #include <stdio.h> 

2 #include <stdlib.h> 

3 

4 int global variable; 

5 static int file static variable; 

6 

7 void func1(void) 

81{ 

9 int funcl variable; 

16 static int local static variable; 

11 

12 printf("&func1 variable..%p\n", (void*)&funcl variable); 
13 printf("&local static variable..%p\n", (void*)&local static variable 
14 } 

15 
16 void func2(void) 
17 { 
18 int func2 variable; 
19 
20 printf("&func2 variable..%p\n", (void*)&func2 variable); 
21 } 
22 
23 int main(void) 
24 { 
25 int *p; 
26 
27 /* 输出 指向 函数 的 指针 */ 
28 printf("funci1..%p\n", (void*)funci1); 
29 printf("func2..%p\n", (void*)func2); 

30 





31 /* 输出 字符 串 字 面 量 的 地 址 */ 





32 printf("string literal..%p\n", (void*)"abc"); 





























33 

34 /* 输出 全 局 变量 的 地 址 */ 

35 printf("&global variable..%p\n", (void*)&global variable); 
36 

37 /* 输出 文件 内 static 变 量 的 地 址 */ 

38 printf("&file static variable..%p\n", (void*)&file static variable); 
39 

40 /* 输出 局 部 变量 */ 

41 func1(); 

42 func2(); 

43 

44 /* 通过 malloc 动 态 分 配 的 内 存 的 地 址 */ 

45 p = malloc(sizeof(int)); 

46 printf("malloc address..%p\n", (void*)p); 

47 

48 return ©; 





在 我 的 环境 中 ， 运 行 结果 如 下 所 示 。 


func1. .9X46657d 

func2. .90X4665b1 

string 1Literal..6x4667696 
&global variable. .0x661654 


&file static variable. .0x60164c 
&funcl1 variable. .6x7fff7faef52c 
&local static variable. .060x66106506 
&func2 variable. .6x7fff7faef52c 
malloc address..6x1d12616 





一 开始 我 们 说 要 输出 变量 的 地 址 ， 但 代码 清单 2-2 的 第 28 行 第 
29 行 却 输出 了 指向 函数 的 指针 。 


如 1-2-3 节 中 所 说 ， 通 过 编译 器 转换 成 机 器 码 的 可 执行 文件 到 了 
运行 的 时 候 融 会 被 放 到 内 存 里 。 也 融 是 说 ， 函 数 的 机 怖 码 当 然 也 是 配置 
在 内 存 中 的 某 个 地 址 上 的 。 


在 C 语言 中 ， 表 达 式 中 的 数组 会 被 解读 为 指针 ， 同 样 地 ， 表 达 式 
中 的 函数 也 意味 着 指向 函数 的 指针 。 孔 数 可 以 通过 函数 调用 运算 符 () 
进行 调用 。 由 于 第 28 行 第 29 行 的 func1、func2 不 带 ()， 所 以 
这 里 不 会 发 生 函 数 调用 ，funcl1、funcl 会 成 为 指向 函数 的 指针 。 而 
且 ， 通 常 这 个 指针 指向 的 是 函数 的 起 始 地 址 。 


是 第 32 行 用 于 输出 被 “"” 引起 来 的 字符 串 〈 字 符 串 字面 量 ) 的 地 
址 。 

在 5 语言 中 ， 字 符 串 表现 为 “char 的 数组 ”。 虽 然 字 符 串 字面 量 
的 类 型 也 是 “char 的 数组 ”， 但 由 于 表达 式 中 的 数组 会 被 解读 为 “ 指 
向 初始 元 素 的 指针 ”， 所 以 表达 式 中 的 "abc” 表示 的 就 是 存放 该 字符 
串 的 内 存 空间 的 起 始 地 址 。 


第 35 行 和 第 38 行 分 别 用 于 输出 全 局 变量 的 地 址 和 文件 内 
static 变量 的 地 址 。 

第 41 行 和 第 42 行 用 于 调用 函数 func1() 和 func2(), 第 12 
行 和 第 20 行 用 于 输出 自动 变量 的 地 址 ， 第 13 行 用 于 输出 static 
局 部 变量 的 地 址 。 


回 到 main() 函数 ， 第 46 行 用 于 输出 通过 malloc() 分 配 的 内 
存 空 间 的 地 址 。 


好 了 ， 我 们 看 一 看 实际 输出 的 地 址 。 
将 地 址 按 顺 序 重新 排列 ， 得 到 表 2-1。 
表 2-1 地 址 一 览 表 


0x601050 static 局 部 变量 





Ox601054 


Ox1d12010 通过 malloc 分 配 的 内 存 空间 


Ox7fff7faef52c func1() 中 的 自动 变量 
Ox7fff7faef52c func2() 中 的 自动 变量 


如 你 所 见 ，“ 指 向 范 数 的 指针 ”与 “字符 串 字 面 量 ”被 放置 在 相当 
接近 的 内 存 区 域 中 。 另 外 ， 不 论 是 局 部 变量 ， 还 是 文件 内 static 变 
量 ， 又 或 是 全 局 变量 ， 所 有 的 静态 变量 都 被 配置 在 相当 接近 的 内 存 区 域 
中 。 离 它 们 稍 远 一 些 的 是 存放 通过 malloc 分 配 的 内 存 空 间 的 区 域 ， 
更 远 的 则 是 存放 自动 变量 的 内 存 区 域 。func1() 的 自动 变量 与 
func2() 的 自动 变量 被 分 配 了 完全 相同 的 内 存 地 址 。 


在 我 的 环境 中 ， 各 个 区 域 的 地 址 如 图 2-3 所 示 。 





0x40057d 附 近 函数 ( 程序 主体 ) 
字符 串 字 面 量 





0x60104 附 近 静态 变量 
( 文件 内 static 变 量 、 
static 局 部 变量 、 全 局 变量 ) 


距离 稍 远 











距离 很 远 





0x7fff7faef52c 附 近 





自动 变量 


图 2-3 各 种 各 样 的 地 址 


些 “ 间 隙 ”的 部 分 是 不 会 被 分 配 物理 内 存 的 ， 因 此 内 存 也 并 不 会 被 浪 


从 图 2-3 可 以 看 出 ， 各 个 区 域 之 间 空 出 了 相当 大 的 间隙 。 当 然 ， 
止 E 
*。 它 们 会 被 用 于 虚拟 内 存 。 


这 
费 


”之 所 以 这 样 配置 ， 是 出 于 安全 性 方面 的 考虑 。 具 体 请 参考 2-5-4 节 的 补充 内 容 。 





下 一 节 ， 我 们 将 对 各 个 区 域 逐 一 进行 说 明 。 
7-3 ”函数 与 字符 串 字 耐量 


2-3-1 只 读 内 存 区 域 


在 我 的 运行 环境 中 ， 椰 数 〈 程 序 ) 主体 与 字符 串 字面 量 被 配置 到 了 
相 邻 地 址 上 。 


这 并 非 偶 然 ， 而 是 由 于 在 如 今 的 大 多 数 操作 系统 中 ， 函 数 主体 与 字 
A 


由 于 水 数 程序 ) 主体 本 就 不 可 能 需要 改写 ， 所 以 被 配置 在 只 读 区 
中 。 其 实在 很 久 以 前 ， 由 机 器 语言 程序 改写 自身 代码 的 技术 倒是 很 常用 
的 "， 但 如 今 绝 大 多 数 操作 系统 禁止 使 用 该 技术 。 


”我 就 使 用 过 这 种 技术 。 在 Z80 语言 中 ， 只 能 通过 直接 指定 绝对 地 址 来 执行 子 程序 调 


话说 ， 怎 么 感觉 自己 变 成 忆 当 年 的 老大 和 爷 了 。 





一 方面 ， 能 够 改写 自身 代码 的 程序 可 读 性 差 ; 另 一 方面 ， 当 执行 程 
序 变 为 只 读 时 ， 在 同时 局 动 多 个 相同 程序 的 情况 下 ， 通 过 在 物理 地 址 上 
共享 程序 ， 能 够 节约 物理 内 存 。 另 外 ， 由 于 硬盘 上 已 经 存放 了 可 执行 程 
序 ， 所 以 就 算 遇 到 了 内 存 不 足 的 情况 ， 也 无 须 将 程序 切换 到 内 存 交 换 


区 ， 直 接 舍弃 掉 就 可 以 。 


对 于 字符 串 字 面 量 ， 如 今 这 些 比较 像样 的 运行 环境 都 将 其 配置 在 只 
读 区 ， 但 以 前 有 些 运行 环境 会 将 其 配置 在 可 写 区 。 因 此 ， 以 前 可 以 通过 
指定 gcc 中 的 -fwritable-strings 选项 使 字符 串 字 面 量变 为 可 
写 ， 但 从 gcc 4.0 开始 ， 该 选项 就 已 经 无 效 了 。 从 标准 来 看 ，ANS1 C 
在 发 布 时 就 已 经 将 改写 字符 串 字 面 量 的 行为 设 为 未 定义 了 ， 所 以 我 们 可 
以 认为 它 就 是 只 读 的 。 


2-3-2 指向 函数 的 指针 


表达 式 中 的 函数 会 被 解读 成 指 疝 范 数 的 指针 ， 因 此 写成 func 就 可 
以 获取 指向 该 函数 的 指针 。 这 正如 代码 清单 2-2 的 验证 结果 所 示 。 


指向 函数 的 指针 说 到 底 还 是 指针 地址 ) ， 因 此 可 以 将 它 赋 给 指向 
函数 的 指针 类 型 的 变量 。 


根据 对 象 函 数 的 返回 值 及 参数 的 不 同 而 不 
同 ， 例 如 : 





int func(double d); 


当 有 这 种 原型 的 函数 func 时 ， 保 存 指向 函数 func 的 指针 的 指 
针 变 量 的 声明 如 下 。 


乍 看 上 去 这 个 变量 声明 可 能 让 人 摸 不 着 头脑 ， 所 以 说 5 语言 的 声 
明 语 法 很 变态 ， 不 过 这 里 再 怎么 发 牢骚 也 没 用 ， 所 以 让 我 们 姑且 将 它 放 
在 一 边 〈 第 3 章 将 详细 说 明 ) ， 来 看 一 看 指向 函数 的 指针 的 用 法 。 


代码 清单 2-3 是 使 用 了 指向 函数 的 指针 的 示例 程序 。 


代码 清单 2-3 func ptr.c 


#include <stdio.h> 


/* 对 参数 加 1.6 后 输出 的 函数 */ 
void func1(double d) 


printf("func1: d+ 1.6 = %f\n", d + 1.0); 
} 


/* 对 参数 加 2.6 后 输出 的 函数 */ 
void func2(double d) 


printf("func2: d + 2.0 = %f\n", d + 2.0); 


main(void) 
void (*func p)(double); 


func p = funcil; 
func_p(1.06); 


func_p = func2; 
func_p(1.6) 


return 0©; 





行 结果 如 下 所 示 。 


li 


funcl: d+ 1.6 2.66066060 


func2: d + 2.0 3.006660 





代码 清单 2-3 为 我 们 准备 了 对 参数 加 1.6 后 输出 的 函数 
func1()， 以 及 加 2.6 后 输出 的 函数 func2()， 第 19 行 用 于 将 
func_p 设置 成 func1() 后 执行 func_p(1.6); 的 调用 ， 第 22 行 
用 于 将 func_p 设置 成 func2() 后 同样 地 执行 func_p(1.6); 的 调 
用 。 虽 然 仅 看 调用 部 分 ， 两 次 调用 写 的 都 是 func_p(1.6);， 但 在 实际 
调用 时 ， 第 1 次 调用 的 是 func1()， 第 2 次 调用 的 却 是 func2()， 


这 正 是 它 的 巧妙 之 处 。 


使 用 func_p(1.6) 这 种 格式 的 函数 调用 ， 就 是 将 函数 调用 运算 符 
() 作用 于 指向 函数 的 指针 func_p 的 意思 。 这 和 我 们 平时 写 
printf("hello.\n"); 时 的 情况 是 一 样 的 。 因 为 此 时 的 表达 式 中 的 
printf 也 被 解读 为 指向 函数 的 指针 了 。 


在 数组 中 ， 当 写成 array[i] 这 样 来 访问 元 素 时 ，array 会 被 解 
法 为 指向 数组 初始 元 素 的 指针 。 我 们 可 以 认为 ， 在 这 一 点 上 ， 丁 数 也 一 


把 指向 函数 的 指针 保存 到 变量 中 的 技术 经 常 被 运用 在 以 下 场合 。 

)1. I 
类 59 & 

)2. 复杂 的 处 理 通 常会 被 整合 成 库 ， 但 在 想 要 对 其 中 一 部 分 处 理 进行 自 
定义 时 ， 例 如 对 于 排序 程序 ， 令 程序 从 外 部 获取 比较 处 理 〈 例 如 标 
准 库 的 qsort()) 。 

)3. 通过 “指向 函数 的 指针 的 数组 ”对 处 理 进 行 分 配 。 


关于 第 3 点 中 的 “指向 函数 的 指针 的 数组 ”， 我 们 会 在 第 5 章 中 
另行 说 明 。 


2 一 4 一 1 什么 是 静态 变量 


所 谓 静 态 变量 ， 就 是 从 程序 启动 直至 结束 为 止 一 直 存 在 的 变量 。 
此 ， 在 《虚拟 ) 地 址 空间 上 ， 静 态 变量 占有 固定 区 域 。 


静态 变量 包含 全 局 变量 、 文 件 内 static 变量 以 及 带 static 限 
定 的 局 部 变量 。 由 于 作用 域 各 不 相同 ， 所 以 这 些 变量 在 编译 或 链接 时 有 具 
有 不 同 的 意义 ， 但 在 运行 时 会 被 当 作 相似 的 对 象 处 理 。 

2-4-2 分割 编 译 与 链接 
在 5 语言 中 ， 一 个 程序 可 以 由 多 个 源 文 件 构成 ， 并 且 这 些 源 文件 


可 以 在 分 别 编译 后 连接 起 来 。 这 在 大 规模 编程 工作 中 是 非常 重要 的 。 的 
确 ， 我 们 不 可 能 让 100 名 程序 员 一 祸 蜂 地 同时 去 折腾 同一 个 文件 。 


男 外 ， 对 于 函数 〈 非 static 限定 ) 和 全 局 变量 ， 只 要 名 称 相 
同 ， 即 便 位 于 不 同 的 源 文 件 中 ， 也 会 被 当 作 相同 的 对 象 处 理 。 这 项 处 理 
工作 由 一 个 叫 作 链接 器 (1 inker 〉 的 程序 完成 (图 2-4) 。 


-> (编译 器 “) 链接 器 一 六 ra 


图 2-4 链接 器 


为 了 让 链接 器 帮 有 我 们 把 名 称 连 接 起 来 ， 在 大 多 数 情况 下 ， 各 个 目标 
人 例 
如 ， 在 UNIX 中 ， 可 以 通过 nm 命令 查看 目标 文件 中 的 符号 表 


这 里 先 跟 大 家 说 一 声 抱歉 ， 接 下 来 要 用 一 下 UNIX 中 特有 的 命令 。 
我 们 先 试 着 在 编译 时 对 print_address.c【〔 代 码 清单 2-2) 加 上 cc - 
c 选项 ， 生 成 print_address. o， 然 后 尝试 对 该 目标 文件 执行 nm。 在 
我 的 环境 中 ， 输 出 结果 如 下 所 示 。 








86606666666666666 b file static variable 
8666666666666666 T func1 

8666666666666634 T func2 

6666666666666664 C global variable 
68666666666666664 b local static variable.28664 
66666606666666654 T main 


U malloc 
U printf 
从 这 个 输出 结果 中 首先 可 以 知道 的 是 ， 连 文件 内 static 变量 和 
局 部 static 变量 这 些 无 顷 连 接 的 内 容 都 会 被 记录 在 符号 表 中 。 


由 于 文件 内 static 变量 和 局 部 static 变量 的 作用 域 不 会 超出 
源 文 件 ， 所 以 它们 没有 必要 与 其 他 文件 的 符号 连接 。 但 是 ， 由 于 需要 通 
过 链接 器 为 静态 变量 分 配 某 个 地 址 ， 所 以 这 些 静 态 变量 也 会 被 记录 到 符 
号 表 中 。 不 过 ， 它们 的 标志 与 全 局 变量 是 个 同 的 (所 谓 标 志 ， 就 是 符号 
名 称 前 显示 的 b 或 者 T 等) 。 全 局 变量 的 标志 为 C， 而 与 外 部 没有 连 
接 的 符号 ， 不 论 是 局 部 的 还 是 文件 内 的 statie 变量 ， 都 被 赋予 了 标 


志 b。 


局 部 static 变量 local static 的 后 面 还 莫名 增加 
了 .2664 这 样 一 个 标记 。 其 实 ， 这 是 一 个 识别 标记 ， 因 为 哪怕 是 在 同 
一 个 .o 文件 中 ， 局 部 static ep st ee 


此 外 ， 了 水 数 名 称 前 加 上 了 T 或 者 U 这 样 的 标志 。 在 当前 文件 中 实 
际 定 义 的 浮 数 名 称 前 加 的 是 T， 而 如 果 水 数 在 外 部 定义 ， 只 是 在 当前 文 
件 内 部 调用 该 函数 ， 则 在 该 函数 名 称 前 加 上 U。 


链接 器 就 是 通过 这 些 信息 ， 给 那些 原先 只 是 个 “名 称 ” 的 对 象 分 配 
具体 地 址 的 ”。 


”由 于 现在 普遍 使 用 动态 链接 的 方式 来 链接 共享 库 ， 所 以 实际 情况 可 没 这 么 简单 





请 注意 ， 自 动 变量 完全 没有 出 现在 符号 表 中 。 这 是 因为 ， 自 动 变量 
的 地 址 是 在 运行 时 决定 的 ， 所 以 它 不 在 链接 器 的 管辖 范围 内 。 


关于 这 一 点 ， 我 们 将 在 下 一 节 中 前 述 


2-5 ”自动 变量 〈 栈 ) | 


2-5-1 内 存 空间 的 “重复 使 用 ” 


根据 代码 清单 2-2 的 验证 结果 ， 可 以 看 出 func1() 的 自动 变量 
funcl variable 和 func2() 的 自动 变量 func2_variable 是 存放 
在 完全 相同 的 地 址 上 的 。 


自动 变量 在 退出 其 声明 所 在 的 函数 后 便 不 再 可 用 了 ， 因 此 退出 
之 后 ， 我 们 完全 可 以 在 随后 调用 的 func2() 中 重复 使 用 相同 
了 空间 。 


要 点 
自动 变量 的 内 存 空间 在 退出 函数 后 可 以 被 其 他 函数 调用 重复 使 
用 。 


自动 变量 的 地 址 因 消 数 调 用 方式 而 异 ， 并 不 是 固定 的 。 





2-5-2 国 数 调用 究竟 发 生 了 什么 


自动 变量 在 内 存 中 究竟 是 怎样 被 保存 的 ? 为 了 更 加 详细 地 了 解 这 一 
点 ， 让 我 们 通过 下 面 的 测试 程序 验证 一 下 《代码 清单 2-4) 。 


代码 清单 2-4 auto.c 





1 #include <stdio.h> 

2 

3 void func(int a, int b) 
{ 


int c, d; 


printf("func:&a..%p &b..%p\n", (void*)&a, (void*)&b); 


4 
5 
6 
7 
8 printf("func:&c..%p &d..%p\n", (void*)&c, (void*)&d); 


16 

11 int main(void) 

12 { 

13 int a, b; 

14 

15 printf("main:&a..%p &b..%p\n", (void*)&a, (void*)&b); 
16 func(1, 2); 

17 

18 return 0©; 





在 我 的 环境 中 ， 运 行 结果 如 下 所 示 。 


main:&a. .0x7fff89124e78 &b. .6x7fff89124e7c 


func:&a. .0x7fff89124e4c &b. .0x7fff89124e48 
func:&c. .0x7fff89124e58 &d..6x7fff89124e5c 





如 果 用 图 说 明 ， 则 如 图 2-5 所 示 。 


Ox7fff89124e48 、 
func () 中 的 形 参 b 


Ox7fff89124e4c func () 中 的 形 参 a 


Ox7fff89124e50 
Ox7fff89124e54 
Ox7fff89124e58 





func () 的 引用 范围 





Ox7fff89124e5c 
Ox7fff89124e60 
Ox7fff89124e64 
Ox7fff89124e68 
Ox7fff89124e6c 
Ox7fff89124e70 
Ox7fff89124e74 
Ox7fff89124e78 
Ox7fff89124e7c 








上 的 引用 范围 


图 2-5 局 部 变量 与 参数 的 地 址 


对 比 一 下 main() 的 引用 区 域 (main() 的 局 部 变量 的 地 址 ) 与 
func() 的 引用 区 域 〈func() 的 局 部 变量 以 及 从 main() 传递 过 来 的 
参数 的 地 址 ) 就 会 发 现 ，func() 的 引用 区 域 具有 相对 较 小 的 地 址 。 


在 C 语言 中 ， 每 次 执行 函数 调用 时 ， 程 序 都 以 “堆积 ”的 方式 在 
当前 已 用 内 存 空间 之 上 为 新 调用 的 函数 分 配 内 存 空 间 。 一 旦 程序 从 函数 
返回 ， 该 内 存 空 间 就 会 被 释放 ， 以 供 下 一 次 函数 调用 时 使 用 。 图 2-6 
粗略 地 表现 了 这 个 过 程 。 


main | main main | 
中 初始 状态 CD 调用 函数 1 人 
we 
ak 
SL 
WAM 
函数 1 | > < 
main | main i en | 
4) 从 函数 2 返回 (9) 从 函数 1 返回 (© 调用 函数 2 


图 2-6 函数 调用 的 概念 图 
像 这 样 “ 堆 积 ” 使 用 的 数据 结构 ， 一 般 称 为 栈 (stack) 。 
a 但 大 部 分 CPU 中 已 经 
府 入 了 栈 的 功能 ，C 语言 的 运行 环境 通常 使 用 这 个 功能 。 请 回忆 一 下 ， 


在 图 2-3 中 ， 存 放 自 动 变量 的 内 存 区 域 之 上 还 有 一 大 块 空 s 闲 区 域 。 栈 
束 在 那里 得 以 慢 慢 延伸 。 


要 点 


在 5 语言 中 ， 自 动 变量 通常 被 分 配 到 栈 中 。 





机 通过 将 自动 变量 分 配 到 栈 中 ， 我 们 可 以 重复 使 用 内 存 空 间 ， 节 约 内 
子 。 


另外 ， 将 自动 变量 分 配 到 栈 中 ， 对 于 递归 调用 〈2-5-6 节 ) 具有 重 


在 5 语言 中 ， 假 设 我 们 使 用 最 朴素 的 实现 方式 ， 那 么 函数 的 调用 
步骤 将 会 是 下 面 这 样 。 但 以 下 步骤 终究 只 是 使 用 “最 朴素 的 实现 万 
式 ” 时 的 产物 ， 因 此 有 些 地 方 不 适用 于 当今 的 运行 环境 。 实 际 上 ， 这 些 
步骤 与 我 现在 使 用 的 环境 也 不 一 臻 《因此 与 图 2-5 也 不 一 致 )。 不 
过 ， 过 去 的 运行 环境 都 是 这 样 的 ， 而 且 如 今 的 运行 环境 表面 上 看 起 来 也 
是 这 样 的 ， 所 以 在 了 解 函数 调用 的 思路 时 ， 以 下 步骤 值得 学 习 。 


调用 方 将 实 参 的 值 从 后 往 前 按 顺序 压 入 栈 中 #。 


”关于 参数 为 什么 要 从 后 往 前 压 入 栈 中 ， 请 参考 2-5-5 节 。 


@) 将 与 函数 调用 相关 的 恢复 信息 〈 返 回 地 址 等 ) 压 入 栈 中 〈 如 图 
2-5 中 灰色 部 分 所 示 ) 。 


所 谓 的 “返回 地 址 ”， 就 是 指 范 数 在 处 理 结束 后 应 该 返回 的 地 
址 。 正 是 由 于 向 栈 中 压 入 了 返回 地 址 ， 所 以 函数 不 论 从 哪里 被 调用 ， 
都 一 定 会 回 到 调用 方 的 下 一 个 处 理 。 

@ 跳 转 至 作为 调用 对 象 的 函数 的 地 址 。 


由 在 栈 中 申请 该 函数 所 用 的 自动 变量 所 需 的 内 存 空间 。GD 人 所 
占用 的 栈 空间 就 是 该 函数 的 引用 区 域 。 


外 在 函数 执行 中 ， 为 了 评估 复杂 的 表达 式 ， 有 时 会 将 计算 过 程 中 
的 值 放 到 栈 中 。 


GO 一旦 函数 执行 结束 ， 局 部 变量 占用 的 内 存 空间 就 会 被 释放 ， 程 
序 利用 恢复 信息 返回 到 原来 的 地 址 。 


从 栈 中 弹出 调用 方 的 参数 。 





当 func(1，2) 被 调用 时 ， 栈 的 使 用 方式 如 图 2-7 所 示 。 


延伸 方向 


计算 过 程 中 的 值 等 


Fr () 


的 局 部 变量 


| 







func() 引用 
的 内 存 空间 


返回 地 址 等 


图 2-7 调用 func(1, 2) 时 栈 的 使 用 方式 


补充 调用 约定 


C 语 言 中 可 以 进行 分 割 编译 ， 还 可 以 跨越 作为 编译 单位 的 源 文件 
进行 函数 调用 。 另 外 ， 也 可 以 链接 事先 编译 好 的 库 文 件 等 。“ 在 
Windows 上 使 用 gcc 作 为 编译 器 ， 由 Windows 调 用 标准 提供 的 库 ” 也 是 
很 寻常 的 做 法 。 也 就 是 说 ， 各 个 编译 器 无 法 擅自 决定 函数 调用 时 参数 


的 传递 方式 。 


因此 ， 根 据 操 作 系统 及 CPU 的 不 同 ， 需 要 规定 不 同 的 调用 方法 ， 
这 就 叫 作 调用 约定 (calling convention) 


本 书 中 说 明 的 调用 方法 是 在 x86 系 列 处 理 器 中 被 称 为 cdec1 的 调用 
约定 。 该 方法 中 所 有 的 参数 都 通过 压 栈 的 方式 进行 传递 。 





但 是 ， 近 年 来 随 着 CPU 的 发 展 进步 ， 可 用 的 寄存 器 也 增多 了 ， 因 
此 在 英特尔 的 64 位 CPU (x86_64 架 构 ) 上 ， 可 以 通过 寄存 器 传递 参 
数 。 正 如 1-2-3 节 提 到 的 那样 ， 这 是 因为 寄存 器 的 访问 速度 比 主 存储 
器 要 快 得 多 。 在 使 用 微软 的 x86_64 调 用 约定 时 ， 可 以 向 寄存 器 传递 4 
个 参数 ， 而 在 使 用 Linux 等 系统 所 用 的 System V ADM 64 AB1 的 调用 约 
定时 ， 可 以 向 寄存 器 传递 6 个 整数 和 指针 参数 ， 或 者 8 个 浮 点 数 参 数 。 
正 是 由 于 通过 寄存 器 传递 的 值 会 被 重新 放置 到 主 存储 器 中 ， 所 以 在 图 
2-5 中 ，func() 的 形 参 被 放 在 了 func() 的 局 部 变量 之 上 的 位 置 *。 


”或 许 有 人 觉得 ， 要 是 还 得 放 回 主 存储 器 ， 那 就 算 把 参数 传递 给 寄存 器 ， 不 也 没 法 
提高 速度 吗 ? 其 实 ， 现 在 我 们 已 经 可 以 通过 “在 编译 时 对 不 使 用 & 运算 符 的 代码 添加 优 
化 选项 ”来 直接 使 用 寄存 器 了 。 


在 32 位 操作 系统 时 代 ，Linux 或 BSD 系 列 的 操作 系统 中 默认 使 用 
cdec1， 因 此 当 实 际 输出 使 用 & 运 算 符 的 变量 的 地 址 时 ， 可 以 直接 观察 
到 “将 参数 从 后 往 前 压 入 栈 中 ” (本 书 的 第 1 版 就 是 这 样 写 的 ) ， 但 
技术 越 进 步 ， 离 “朴素 的 实现 方式 ”也 就 越 远 ， 同 时 初学 者 要 跨越 的 
门槛 也 越 来 越 高 了 。 我 们 后 面 会 讲 到 ， 将 参数 从 后 往 前 压 入 栈 中 的 做 
法 与 可 变 长 参数 的 构成 是 紧密 相连 的 ， 所 以 想 要 搞 懂 可 变 长 参数 ， 

从 “朴素 的 实现 方式 ”入 手 是 最 方便 的 。 





2-5-3 ”自动 变量 的 引用 


我 们 在 1-3-4 市 的 补充 内 容 中 提 到 ， 对 于 非 static 局 部 变量 
(自动 变量 ) ， 通 常 其 变量 名 也 不 残留 在 编译 后 的 目标 文件 中 。 另 外 ， 
2-4-2 节 的 末尾 提 到 ， 自 动 变 量 的 地 址 是 在 运行 时 决定 的 ， 所 以 它 不 在 
链接 需 的 管辖 范围 内 。 


我 们 一 直 在 强调 ， 自 动 变 量 的 地 址 是 在 运行 时 决定 的 。 那 么 ， 具 体 
来 说 ， 实 际 编译 完成 的 机 器 码 究竟 是 怎样 引用 局 部 变量 的 呢 ? 


与 其 在 这 里 妹妹 明明 ， 不 如 看 一 下 汇编 代码 ， 这 样 可 以 更 快 理解 这 
一 点 。 虽 然 这 里 是 以 我 的 特定 环境 〈x86_64) 为 例 进行 说 明 的 ， 但 其 实 


无 论 在 哪 种 CPU 上 ， 思 路 都 大 体 相 同 。 


下 面 以 接收 两 个 变量 ， 然 后 将 变量 相 加 并 返回 结果 的 add_func() 
了 为 数 为 例 思考 一 下 〈 代 码 清单 2-5) 


代码 清单 2-5 add func. c 


1 int add func(int a, i 
24 

3 int result; 

4 
5 result = a + Db; 

6 
7 return result; 

8 


} 


通过 gcc 的 -S 选项 将 以 上 代码 转换 为 汇编 代码 ， 如 代码 清单 2- 
6 所 示 《市 选 ) 





代码 清单 2-6 add func. s 





add func : 
.LFB6 : 


.Cfi_ startproc 

pushq  %rbp <-- 将 %rbp 寄 存 器 压 栈 保存 

.Cfi def cfa offset 16 

.Cfi offset 6, -16 

movq %rsp, %rbp <-- 将 %rsp 寄 存 器 复制 到 %rbp 寄 存 器 
.Cfi def_cfa_register 6 

mov1 %edi，-26(%rbp) <-- 将 %edi 的 内 容 赋 给 参数 a 

mov1 %esi，-24(%rbp) 《<-- 将 %esi 的 内 容 赋 给 参数 b 








mov1 -24(%rbp)，%eax 《<-- 将 b 的 内 容 赋 给 %eax 
mov1 -26(%rbp)，%edx 《<-- 将 a 的 内 容 赋 给 %edx 
add1l %edx，%eax <-- 将 %edx 与 %eax 相 加 之 和 赋 给 %eax 


mov1 %eax, -4(%rbp) <-- 将 %eax 赋 给 result 


mov1 -4(%rbp), %eax <-- 将 result 赋 给 Xeax 
popq %rbp 将 %rbp 寄 存 器 出 栈 恢 复 

.Cfi def_cfa 7, 8 

Pet <-- 返回 调用 方 
.Cfi_endproc 





可 能 有 些 人 一 看 到 汇编 语言 就 惊恐 不 已 ， 但 这 里 使 用 的 命令 其 实 非 
常 少 ， 你 完全 可 以 顺 着 读 下 来 。 


首先 ， 以 英语 句号 开头 的 那些 代码 行 是 针对 汇编 器 的 命令 
(directive) ， 可 以 无 视 。 


第 4 行 中 的 pushq %rbp 表示 把 名 为 %rbp 的 寄存 器 的 内 容 压 入 
栈 中 。 第 7 行 是 把 名 为 %rsp 的 寄存 器 的 内 容 复 制 到 %rbp 中 。movq 
和 movl 等 命令 是 取 两 个 操作 数 〈 类 似 于 参数 的 对 象 ) ， 把 左 操作 数 的 
值 复制 (move) 到 右 操作 数 。 


%rbp 寄存 器 被 称 为 基 指 针 * (basic pointer) ， 它 会 以 其 指向 的 
地 址 为 基准 访问 局 部 变量 。%rsp 寄存 器 被 称 为 栈 指针 〈stack 
pointer) ， 指 向 栈 顶 。 把 栈 指 针 的 值 复制 到 基 指 针 ， 就 意味 着 基 指 针 
当前 指向 栈 顶 。 


” 基 指 针 是 x84 和 x86_64 中 的 用 语 ， 在 很 多 情况 下 也 被 称 为 帧 指针 (frame 


pointer) 。 





随后 的 第 9 行 和 第 10 行 用 于 把 调用 涵 数 时 经 由 寄存 器 传递 过 来 
的 值 复制 到 形 参 的 内 存 空间 中 。%edi 和 %esi 都 是 寄存 
器 。-26(%rbp) 是 指 从 基 指 针 减 去 20 字 节 后 得 到 的 地 址 。 像 这 样 ， 
距 基 指 针 一 定 距 离 的 位 置 就 是 形 参 或 者 局 部 变量 的 地 址 ， 如 图 2-8 所 
夏 请 与 图 26: 对比 二 下 s 


基 指 针 -24 一 > 


基 指 针 -20 一 > 


基 指针 -4 一 > 


基 指 针 一 > 





图 2-8” 基 指针 与 局 部 变量 


第 11 行 和 第 12 行 用 于 把 局 部 变量 的 内 容 保存 到 寄存 器 中 ， 第 
13 行 用 于 执行 加 法 运算 。 然 后 是 将 加 法 运算 的 结果 保存 到 局 部 变量 
result 中 (第 14 行 ) ， 进 而 把 result 的 内 容 保存 到 寄存 器 %eax 
WR 
%eax 5 


接 下 来 ， 程 序 会 把 通过 第 4 行 压 入 栈 中 的 值 恢复 到 基 指 针 中 ， 并 
返回 调用 方 。 

面 对 突 如 其 来 的 汇编 语言 代码 ， 一 开始 你 或 许 会 感到 恐 民 ， 但 这 样 
读 下 来 之 后 ， 相 信 对 于 “局 部 变量 是 通过 相对 于 基 指 针 的 偏 移 量 来 引用 
的 ”这 个 事实 ， 你 已 经 有 了 直观 的 理解 。 


补充 “一 旦 函数 执行 结束 ， 自 动 变量 的 内 存 空间 就 会 被 释放 
初学 者 有 时 会 写 出 下 面 这 样 的 程序 。 





/* 将 int 转 换 为 字符 串 的 程序 */ 
char *int to str(int int value) 


{ 





char buf[208]; 


sprintf(buf, "%d", int value); 


return buf; 





但 是 ， 这 个 程序 恐怕 无 法 正常 运行 。 


或 许 在 某 些 环境 下 能 正常 运 行 ， 但 那 只 是 偶然 。 





原因 想必 大 家 已 经 明白 了 。 是 因为 在 函数 执行 结束 那 一 刻 ， 自 动 
变量 buf 的 内 存 空间 就 会 被 释放 。 


要 想 让 这 个 程序 跑 起 来 ， 可 以 像 下 面 这 样 声 明 buf。 


static char buf[26]; 


这 样 一 来 ，buf 的 内 存 空 间 就 会 一 直 处 于 静态 ， 即 便 函 数 执行 
结束 ， 也 不 会 被 释放 。 


但 是 ， 如 果 这 样 做 ， 在 连续 两 次 调用 该 函数 时 ， 次 调用 所 
获取 的 字符 串 的 内 容 会 在 第 2 次 调用 时 被 “偷偷 地 ” A 


str1i = int to str(5); 


str2 = int to str(10); 
printf("str1..%s，str2..%s\n"，str1，str2); <-- 那么 ， 会 显示 出 什么 内 容 呢 ? 





程序 员 的 本 意 可 能 是 输出 str1..5，str2..16， 但 这 个 程序 却 
无 法 让 他 如 愿 。 


这 样 的 函数 会 引发 意 想不到 的 Bug 。 此 外 ， 在 编写 多 线程 程序 
时 ， 也 会 引发 一 些 问 题 。 


”标准 库 中 有 一 个 叫 作 strtok() 的 函数 ， 该 函数 也 有 着 类 似 的 性 质 ， 因 而 时 常 


车 得 大 家 怨声载道 。 


为 了 避免 这 个 问题 ， 可 以 使 用 malloc() 动态 分 配 内 存 (2-6 
节 ) ， 不 过 这 样 一 来 ， 就 必须 在 使 用 它 的 地 方 调用 free()。 


如 果 调 用 方 事 先知 道 数 组 长 度 的 上 限 ， 那 么 比较 好 的 做 法 是 ， 像 
代码 清单 1-10 一 样 ， 在 调用 方 定 义 一 个 数组 ， 把 结果 存放 进 数 组 。 
如 果 调 用 方 无 法 得 知 数组 长 度 的 上 限 ， 那 就 只 能 借助 malloc() 








2-5-4 ”上 典型 的 安全 漏洞 一 一 缓冲 区 浇 出 漏 尊 

例如 ， 像 下 面 这 样 通过 自动 变量 声明 一 个 数组 。 

假设 没有 进行 数组 范围 检查 ， 向 超出 数组 内 存 空间 的 地 方 进行 了 写 
入 操作 ， 那 么 会 发 生 什 么 呢 ? 
容 。 但 是 ， 如 果 破 坏 了 更 远 更 深 的 内 存 空 间 呢 ? 


自动 变量 是 保存 在 栈 中 的 ， 数 组 也 一 样 。 使 用 图 来 说 明 ， 上 述 数组 
应 该 如 图 2-9 所 示 。 


恢复 信息 
返回 地 址 等 








图 2-9 栈 中 的 数组 


这 里 ， 如 果 对 远 远 超出 数组 hoge 的 内 存 空间 的 地 方 进行 了 写 入 ， 
则 连 该 函数 的 恢复 信息 都 会 遵 到 破坏 。 这 也 就 意味 着 ， 该 函数 将 无 法 返 
回 。 


当 你 追踪 有 Bug 的 程序 的 行为 ， 发 现 明 明子 数 处 理 一 直 执 行 到 了 
最 后 ， 函 数 却 没有 返回 到 调用 方 时 ， 就 应 该 怀疑 是 不 是 遇 到 这 种 情况 

在 这 种 情况 下 ， 即 便 进 行 调试 ， 也 往往 无 法 查 明 程序 月 溃 的 具体 位 
置 。 因 为 调试 需要 用 到 被 压 入 栈 中 的 信息 ， 所 以 当 栈 被 大 规模 破坏 时 ， 
自然 就 无 法 追踪 了 。 


然而 ， 程 序 朋 演 还 算是 好 的 ， 假 如 自动 变量 的 数组 洪 出 导致 恢复 信 
息 〈 返 回 地 址 ) 被 禾 震 ， 甚 至 会 引发 安全 漏洞 。 


如 果 没 有 认真 地 对 程序 进行 数组 范围 检查 ， 那 么 当 恶意 攻击 者 故意 


导入 大 量 数据 时 ， 返 回 地 址 就 会 被 恶意 数据 替换 掉 。 然 后 ， 当 该 也 数 执 
行 结束 时 ， 后 续 处 理 就 会 从 这 个 伪装 的 返回 地 址 开始 继续 执行 ， 因 此 如 
果 在 其 中 这 里 也 是 作为 输入 数据 ) 放 入 攻击 用 的 机 器 码 ， 攻 击 者 就 可 
以 让 该 程序 执行 任意 的 机 器 码 ， 这 称 为 缓冲 区 洪 出 漏洞 。 


关于 漏洞 的 新 闻 报道 中 经 常 提 到 “可 执行 任意 代码 的 漏洞 ”， 这 里 
的 缓冲 区 溢出 漏洞 就 是 其 中 一 种 。 


代码 清单 2-7 展示 了 一 个 利用 缓冲 区 溢出 覆盖 返回 地 址 的 示例 程 
了 也。 


代码 清单 2-7 buffer overflow.c 


1 #include “stdio.h> 
2 
3 void hello(void) 


fprintf(stderr, "hello!\n"); 


oid func(void) 


void *buf[18]; 
static int i; 


for (i = 86; i < 166; i++) { 
buf[i] = hello; 

} 

main(void) 


int buf[1666] ; 
buf[999] = 108; 


func(); 


return ©; 





人 在 我 的 环境 
中 ， 报 出 警告 的 是 将 指向 函数 的 指针 保存 到 void* 的 变量 的 地 方 (第 
4 行 ， 与 代 租 清音 2-2 一 样 ) ， 还 有 一 个 敬告 是 数组 buf 未 使 用 
(第 10 行 和 第 20 行 ) 。 这 是 一 个 实验 ， 所 以 请 无 视 这 些 警 千 


并 非 在 所 有 环境 中 都 会 这 样 。 在 我 的 环境 中 ， 该 程序 执行 后 会 显示 
几 次 “hello!”， 然 后 就 会 报 出 Segmentation fault。 


无 论 怎么 看 ， 源 代码 中 都 没有 调用 hello()， 可 事实 上 却 调用 
了 。 


这 是 由 于 在 第 13 行 ”第 15 行 的 循环 中 ， 在 超出 数组 buf 的 元 
素 个 数 (10) 的 地 方 被 执行 了 了 写 入 ， 因 而 指向 函数 hello() 的 指针 履 
盖 了 返回 地 址 。 指 向 函数 的 指针 通常 是 该 函数 的 机 器 码 的 起 始 地 址 ， 
此 当 返 回 地 址 被 它 履 盖 后 ， 就 会 发 生 明 明 打 算 从 func() 返回 ， 却 跳 
转 到 了 hello() 的 现象 。 由 于 栈 中 稍 前 的 位 置 填充 有 指向 hello() 
的 指针 ， 所 以 当 hello() 执行 结束 后 ， 程 序 还 会 跳 转 到 hello()。 


这 次 的 源 代码 把 指向 hello() 的 指针 保存 到 了 数组 中 ， 但 如 果 是 
把 来 自 网络 等 外 部 渠道 的 数据 保存 到 数组 ， 又 踊 于 范围 检查 ， 就 可 能 受 
到 来 自 外 部 的 攻击 ， 使 程序 跳 转 到 任意 地 址 。 也 就 是 说 ， 有 可 能 引发 可 
执行 任意 代码 的 漏洞 。 对 于 这 一 点 ， 相 信 大 家 已 经 有 了 深切 的 感受 


C 语言 的 标准 库 中 从 前 就 有 一 个 gets() 函数 ， 它 是 类 似 于 
fgets() 的 从 标准 输入 获取 一 行 输 入 的 函数 。 但 二 者 实际 上 又 有 所 不 
同 ， 我 们 无 法 向 gets() 传递 缓冲 区 的 长 度 。 因 此 ，gets() 是 无 法 进 
行 数组 范围 检查 的 。 在 C 语言 中 ， 在 将 数组 作为 参数 传递 时 ， 传 递 的 
只 不 过 是 指向 数组 初始 元 素 的 指针 而 已 ， 调 用 方 无 法 知晓 该 数组 的 长 


度 。 


而 且 ，gets() 要 在 数组 中 保存 的 是 标准 输入 ， 即 “来 自 外 部 ”的 
输入 。 因 此 ， 对 使 用 gets() 的 程序 ， 能 够 通过 刻意 使 其 接收 含有 庞 
大 数据 的 行 ， 来 故意 引发 数组 淤 出， 改写 返回 地 址 。 


1988 年 通过 网 络 繁衍 的 著名 病毒 “网 络 蠕虫 ”攻击 的 就 是 
gets ( ) 的 这 个 漏洞 。 


鉴于 此 ， 如 今 gets() 已 经 被 视 作 过 时 的 函数 。gcc 从 很 久之 前 


就 给 出 了 警告 ， 而 C11 最 终 将 其 删除 了 。 


不 只 是 gets()， 比 如 在 scanf() 中 使 用 "%s" 也 会 招致 同样 的 
结果 〈 不 过 ， 在 scanf() 中 可 以 通过 像 "%16s" 这 样 指定 格式 ， 来 限 
制 字符 串 的 最 大 长 度 ) 。 另 外 ，strcpy() 或 sprintf() 也 是 ， 如 果 
不 能 在 使 用 时 明确 预测 所 需 的 缓冲 区 长 度 ， 也 一 样 会 招致 缓冲 区 溢出 漏 
洞 。 为 了 回避 这 个 问题 ，099 准备 了 snprintf()，C11 准备 了 
sprintf_s() 这 样 的 函数 。 对 此 ，6-1-1 节 将 予以 说 明 。 


补充 “操作 系统 针对 缓冲 区 溢出 漏洞 给 出 的 对 策 


缓冲 区 溢出 漏洞 有 可 能 变 成 可 执行 任意 代码 的 漏洞 。 这 也 是 漏洞 
当中 最 令 人 感到 束 手 的 漏洞 。 而 且 ， 在 C 语言 中 ， 经 常会 由 于 程序 
员 忽视 数组 范围 检查 这 一 非常 常见 的 Bug 而 导致 该 漏洞 的 产生 。 


因为 这 是 一 种 危险 至 极 的 漏洞 ， 所 以 除了 依靠 程序 员 的 准确 判 
断 ， 人 们 还 在 操作 系统 层面 采取 了 对 策 。 


其 中 之 一 就 是 称 为 地 址 空间 布局 随机 化 (Address Space 
Layout Randomization，ASLR) 的 功能 。 这 一 功能 用 于 在 程序 启动 
时 ， 在 一 定 程度 上 随机 决定 栈 或 堆 的 地 址 。 


在 缓冲 区 浇 出 漏洞 中 ， 攻 击 者 在 栈 上 重 写 返回 地 址 ， 使 程序 跳 转 
到 另行 读 取 的 攻击 用 代码 的 起 始 地 址 。 在 使 程序 读 取 攻 击 用 代码 的 方 


法 中 ， 有 一 种 方法 比较 轻松 ， 那 就 是 既然 程序 琉 于 数组 范围 检查 ， 就 
通过 使 程序 接收 大 量 数据 ， 在 窗 盖 返回 地 址 的 同时 将 攻击 用 代码 注入 
到 栈 中 。 然 后 ， 束 这 样 用 植 入 的 攻击 用 代码 的 起 始 地 址 宪 茧 掉 返 回 地 
址 。 但 是 ， 当 栈 的 空间 变 为 随机 配置 时 ， 攻 击 者 就 无 法 预测 攻击 用 代 
码 的 起 始 地 址 了 ， 因 而 攻击 就 会 变 得 困难 。 


话 哩 如此， 其 实 攻 击 者 并 非 必须 以 字 节 为 单位 准确 指定 攻击 用 代 
码 的 起 始 地 址 。 在 开头 部 分 填充 空 指 令 (No 0peration Performed， 
NOP) ， 然 后 让 程序 跳 转 到 这 个 NOP 部 分 的 某 处 亦 可 。 另 外 ， 在 某 些 
条 件 下 ， 攻 击 者 可 能 可 以 进行 多 次 攻击 。 这 么 考虑 的 话 ， 可 以 认为 基 
于 ASLR 的 防御 也 并 不 是 万 无 一 失 的 。 或 者 说 ， 在 考虑 安全 漏洞 之 
前 ， 跑 于 数组 范围 检查 的 程序 出 问题 ， 这 本 身 就 是 Bug， 因 此 应 该 对 





它 进行 修正 。 


还 有 一 种 对 策 ， 即 数据 执行 保护 (Data Execution 


Prevention，DEP) 的 功能 。 这 一 功能 利用 CPU 的 功能 ， 使 栈 或 堆 中 
的 机 器 码 无 法 执行 。 但 是 ，Java 等 语言 的 JIT (Just In Time， 即 
时 ) 编译 器 等 必须 要 先 在 数据 空间 中 生成 机 器 码 才 能 执行 ， 可 是 有 了 
DEP， 编 译 器 就 无 法 工作 了 。 在 这 样 的 程序 中 ， 在 从 堆 中 获取 内 存 分 
配 时 ， 需 要 使 用 不 设 执行 保护 标志 的 特别 的 内 存 分 配 函 数 。 





2-5-5 ”可 变 长 参数 
在 5 语言 中 可 以 编写 可 变 长 参数 函数 ， 其 中 比较 典型 的 是 大 家 熟 
知 的 printf()。printf() 根据 第 1 个 参数 (格式 指定 字符 串 ) 中 
包含 的 转 义 字符 〈%d 等 ) 的 个 数 ， 确 定 第 2 个 参数 及 其 后 的 内 容 。 
2-5-2 节 中 提 到 ， 在 朴素 的 实现 方式 中 实 参 的 值 是 从 后 往 前 按 顺序 
压 栈 的 。 可 能 有 人 会 想 ， 要 压 栈 ， 那 就 老 老实 实地 从 前 往 后 压 不 就 好 
了 ? 之 所 以 采用 从 后 往 前 压 栈 的 方式 ， 其 实 是 为 了 实现 可 变 长 参数 。 
例如 ， 当 有 如 下 调用 时 ， 栈 应 该 会 呈现 出 如 图 2-10 所 示 的 状态 。 


printf("%d, %s\n", 160, str); 





BE 
的 局 部 变量 


恢复 信息 
返回 地 址 等 printf () 引用 的 
内 存 空间 





图 2-10 ”可 变 长 参数 函数 的 调用 


此 时 重要 的 是 不 论 压 进 多 少 个 参数 ， 总 能 找到 第 1 个 参数 的 地 
址 。 从 图 中 可 以 看 出 ， 在 printf() 的 局 部 变量 看 来 ， 第 1 个 参数 
(指向 "%d，%s\n” 的 指针 )〉 必定 存在 于 仅 距 离 自 身 一 定 距 离 的 地 
方 。 以 printf() 为 例 ， 只 要 能 够 获取 第 1 个 参数 ， 就 能 够 通过 解析 
字符 串 "%d，%s\n” 知晓 后 面 还 有 多 少 个 什么 样 的 参数 。 由 于 其 余人 参 
数 都 排列 在 第 1 个 参数 之 后 ， 所 以 我 们 可 以 按 顺 序 将 它们 依次 取出 。 


如 果 人 参数 是 从 前 往 后 按 顺序 压 栈 的 ， 那 么 即使 找到 了 末尾 的 参数 ， 
也 无 法 知晓 第 1 个 参数 在 哪里 。 正 是 得 益 于 从 后 往 前 的 压 栈 方式 ， 可 
变 长 参数 才 得 以 实现 。 


只 要 能 够 获取 第 1 个 参数 ， 其 余人 参数 应 该 就 会 按 顺序 排列 在 其 后 
一 一 话 虽 如 此 ， 现 实 中 这 在 一 定 程 度 上 还 是 依赖 于 运行 环境 的 。 因 此 ， 
为 了 提高 可 移植 性 ，ANS1 C 通过 头 文件 stdarg. h” 提供 了 一 组 便于 使 
用 可 变 长 参数 的 宏 。 


”ANSI1 C 之 前 的 5 语言 使 用 的 是 头 文件 varargs. h。 它 与 stdarg. h 在 使 用 方法 上 


有 很 大 的 差异 。 





接 下 来 ， 我 们 使 用 stdarg. h 尝试 编写 一 个 可 变 长 参数 函数 。 
这 里 考虑 编写 一 个 仿照 printf() 的 tiny_printf()。 


tiny_printf() 的 第 1 个 参数 指定 的 是 后 续 参 数 的 类 型 ， 第 2 
个 及 其 后 的 参数 指定 的 是 要 输出 的 值 。 


tiny_printf("sdd", "result..", 3, 5); 





在 本 例 中 ， 第 1 个 参数 "sdd" 指定 后 续 参 数 类 型 为 “字符 
串 、int、int” (与 printf() 一 样 ，s 代表 字符 串 ，d 代表 整数 
值 ) 。 第 2 个 及 其 后 的 参数 向 函数 传递 了 字符 串 "result.."” 和 两 个 
整数 。 

执行 结果 如 下 所 示 。 


result.. 3 5 


与 printf() 不 同 ， 由 于 指定 换行 符 的 输出 比较 麻烦 ， 所 以 
tiny_printf() 在 默认 情况 下 会 主动 换行 。 


代码 如 代码 清单 2-8 所 示 。 


代码 清单 2-8 tiny printf.c 





1 #include <stdio.h> 

2 #include <stdarg.h> 

3 #include <assert.h> 

4 

5 void tiny printf(char *format, ...) 


61{ 

7 int i; 

8 va_list ap; 

9 

16 va_start(ap, format); 

11 for (i = 6;j format[i] != '\6'; i++) { 
12 switch (format[i]) { 

13 Case 's': 

14 printf("%s ", va_arg(ap, char*)); 
15 break; 

16 case 'd': 

17 printf("%d ", va_arg(ap, int)); 
18 break; 
19 default: 
20 assert(0); 
21 
22 } 
23 va_end(ap); 
24 putchar('\n'); 
25 } 
26 
27 int main(void) 
28 { 
29 tiny_printf("sdd", "result..", 3, 5); 
30 

31 return ©; 





从 第 5 行 开始 是 函数 定义 。 对 于 形 参 声明 中 的 “…” 这 种 写法 ， 
可 能 大 家 会 感到 陌生 ， 不 过 原型 声明 也 是 这 么 与 的 。 在 原型 声明 中 ， 如 
果 人 参数 中 出 现 “…”， 那 么 这 部 分 融 不 用 进行 参数 类 型 检查 。 


第 8 行 声 明了 va_list 类 型 的 变量 ap。va_list 是 在 
stdarg.h 中 定义 的 类 型 “。 在 我 的 环境 〈gcc) 中 ， 该 类 型 会 变 成 名 为 
_ gnuc_var_list” 的 gcc 和 通 入 类 型 ， 不 过 以 前 它 只 是 单纯 的 char* 
的 typedef 而 已 。 大 家 可 以 暂且 把 它 理解 成 某 种 指针 。 


这 多 半 是 variable argument list 的 缩写 。 


”通常 写作 __gnuc_va_1ist， 所 以 这 里 可 能 是 作者 笔 误 ， 但 由 于 Linux 的 环境 比 
较 多 样 化 ， 所 以 也 不 排除 在 作者 的 运行 环境 中 就 是 这 个 结果 。 译 者 注 





第 10 行 的 va_start(ap，format); 表示 将 指针 ap 指向 参数 
format 的 下 一 个 位 置 。 


这 样 我 们 就 得 到 了 参数 的 可 变 长 部 分 的 “开头 提示 ”。 后 面 的 第 
14 行 和 第 17 行 是 在 大 va_arg() 中 指定 ap 和 参数 的 类 型 ， 如 此 一 
来 ， 我 们 就 可 以 依次 取出 参数 的 可 变 长 部 分 了 。 


第 23 行 的 va_end() 是 对 应 于 va_start() 的 内 容 。 在 把 可 变 
长 参数 传递 给 寄存 器 的 运行 环境 中 ， 需 要 通过 va_start() 分 配 内 存 
并 将 参数 保存 其 中 ， 然 后 通过 va_end() 释放 内 存 。 


宏 va_arg() 会 将 参数 ap 推进 至 下 一 个 参数 ， 但 在 程序 处 理 
中 ， 有 时 也 会 需要 ap 在 前 进 后 再 次 回 到 原来 的 位 置 。 在 这 种 情况 下 ， 
有 人 可 能 会 觉得 在 ap 前 进 之 前 ， 像 下 面 这 样 事先 获取 它 的 备份 就 好 
Ts 


va_list ap_copy = ap; 


但 在 某 些 运行 环境 中 ， 这 种 做 法 是 行 不 通 的 。 前 面 我 们 提 到 “大 家 
可 以 暂且 把 它 理解 成 某 种 指针 ”， 是 因为 实际 上 它 有 时 并 不 是 指针 〈 有 
可 能 是 由 运行 环境 定义 的 “ 谜 ” 之 类 型 ， 或 者 是 元 素 个 数 为 1 的 指针 
数组 ) 。 为 了 能 够 在 这 些 场景 中 复制 ap，C99 中 提供 了 宏 
va_copy()。 


这 里 需要 注意 的 是 ， 在 可 变 长 参数 函数 中 ， 由 于 必须 从 前 往 后 按 顺 
序 指定 参数 类 型 并 获取 ， 所 以 此 时 如 果 不 知 道 类 型 和 最 后 一 个 参数 ， 就 
无 法 实现 可 变 长 参数 函数 。 


printf() 能 够 方便 地 将 输出 内 容 整 理 得 干净 利落 ， 但 如 果 只 是 想 
输出 一 点 点 内 容 ， 使 用 printf() 就 显得 小 题 大 做 了 。 此 时 你 可 能 会 
想像 下 面 这 样 单纯 地 将 想 要 输出 的 内 容 用 逗号 隔 开 排列 ， 





然后 输出 


a..16 b..5 


但 是 这 在 C 语言 中 是 做 不 到 的 。 因 为 在 这 个 设计 中 ，writeln() 
无 法 获知 参数 的 类 型 和 个 数 。 


话说 回来 ， 一 旦 学 会 了 可 变 长 参数 函数 的 写法 ， 我 们 就 会 觉得 这 个 
写法 酷 酷 的 ， 不 管 在 什么 地 方 都 想 用 一 用 。 我 曾经 就 是 如 此 。 


”当年 我 也 是 年 少 无 知 ， 看 到 XView 里 的 函数 使 用 方法 还 觉得 很 酷 。 





然而 ， 对 于 可 变 长 参数 函数 ， 通 过 原型 声明 进行 的 参数 类 型 检查 是 
无 效 的 。 另 外 ， 被 调用 方 只 能 完全 相信 调用 方 传递 过 来 的 参数 是 正确 的 
“。 从 这 些 情况 来 看 ， 可 变 长 参数 函数 的 调试 经 常会 比较 困难 。 因 此 ， 
建议 只 在 “不 使 用 可 变 长 参数 的 话 代码 写 起 来 很 难 ” 的 情况 下 使 用 。 


”gcc 等 编译 器 会 报 出 “printf() 的 格式 指定 符 与 实际 参数 的 类 型 不 一 致 ”的 警 
告 ， 但 这 说 到 底 只 是 由 于 编译 器 对 printf() 进行 了 特殊 处 理 。 毕 竟 printf() 是 一 个 非 
常常 用 的 函数 。 


补充 assert () 


在 代码 清单 2-8 的 第 20 行 中 ， 有 “assert(8);” 这 样 的 代码 。 


assert() 是 在 assert.h 中 定义 的 宏 ， 用 法 如 下 所 示 。 


当 条 件 表 达 式 为 真 时 ， 什 么 都 不 做 ， 而 当 其 为 假 时 ， 则 会 输出 信 





息 ， 然 后 强制 终止 程序 。 
我 们 经 常会 在 代码 中 看 到 下 面 这 样 的 注释 。 





/* 这 里 的 str[i] 必 须 是 '\@' */ 





这 种 注释 虽然 对 提高 程序 的 可 读 性 是 有 益 的 ， 但 单 任 这 句 注释 ， 
程序 不 会 在 运行 时 进行 任何 检查 。 所 以 还 不 如 写成 下 面 这 样 ， 因 为 这 
样 写 才能 切切 实 实 地 检 出 Bug， 我 觉得 这 要 好 得 多 。 


assert(str[i] == '\0'); 


由 于 在 代码 清单 2-8 中 ，“assert(6);” 指 定 了 参数 为 
0 假 )， 所 以 程序 执行 只 要 经 过 这 里 ， 就 会 被 哩 制 终 止 。 只 要 程序 
本 身 没有 Bug， 这 个 switch 语句 是 绝对 不 会 走 到 default 中 
的 ， 所 以 这 么 写 就 可 以 了 。 


很 多 人 对 使 用 “强制 终止 程序 运行 ”这 一 手段 来 进行 异常 处 理 是 
持 反 对 意见 的 。 的 确 ， 如 果 只 是 用 户 做 了 一 些 奇怪 的 操作 ， 或 者 接收 
和 就 草率 地 让 程序 终止 运行 ， 那 也 挺 令 人 困扰 


但 是 ， 排 除 这 样 的 外 部 因素 ， 在 只 要 程序 本 身 没有 Bug 就 绝对 
不 会 发 生 异常 的 情况 下 ， 一 旦 出 现 了 异常 ， 我 觉得 还 是 应 该 果断 终止 
程序 。 若 只 是 气 定神 闲 地 通过 返回 值 返回 错误 状态 ， 那 万 一 调用 方 丛 
懒 没有 对 返回 值 进行 检查 *， 就 会 造成 Bug 流出 。 


| ”这 是 常 有 的 事 。 


再 说 ， 在 像 C 语言 这 样 动不动 就 破坏 内 存 空间 的 语言 中 ， 能 够 
明确 检 出 Bug， 就 意味 着 这 个 程序 的 动作 几乎 就 是 富 无 保障 的 了 。 就 
算 你 想 要 返回 错误 状态 ， 要 是 连 栈 也 被 损坏 了 的 话 ， 那 就 连 return 
都 做 不 到 了 。 


”如 果 是 不 会 引起 内 存 损坏 且 具 有 异常 处 理 机 制 的 语言 ， 返 回 异常 反而 是 正确 的 做 


让 我 们 趁 潜 在 Bug 尚未 引发 更 糟糕 的 状况 ， 富 不 犹 殉 地 将 它 扼 
杀 在 摇篮 里 吧 ”! 


”如 果 正 在 编辑 重要 数据 ， 那 就 应 该 采取 紧急 保存 措施 。 当 然 ， 文 件 名 需要 与 一 般 
情况 下 的 不 同 。 


补充 “ 试 写 一 个 用 于 调试 的 函数 


通过 printf() 输 出 变量 值 是 广 为 流 传 的 调试 方法 。 


”虽然 经 常 听 到 别人 说 “请 使 用 调试 器 ! ”， 但 在 许多 情况 下 ，printf() 调试 更 
合适 。 


但 如 果 使 用 这 种 方法 ， 那 么 还 需要 在 调试 结束 后 删除 为 调试 而 与 
的 printf()， 这 很 麻烦 。 因 此 ， 有 些 书 会 推荐 如 下 所 示 的 写法 。 


#ifdef DEBUG 
printf( 想 要 显示 的 内 容 ); 
#endif /* DEBUG */ 


但 如 果 在 代码 中 大 量 地 加 入 这 种 内 容 ， 代 码 的 可 读 性 就 会 很 





这 时 ， 人 们 就 会 想 要 下 面 这 种 能 够 像 printf() 一 样 使 用 的 函 





debug write("hoge..%d, piyo..%d\n", hoge, piyo); 


可 是 ， 由 于 printf() 是 具有 可 变 长 参数 的 函数 ， 所 以 无 法 实 
现 单纯 地 通过 debug_write() 函数 重新 调用 printf() 的 功能 。 
所 以 说 ， 自 己 实现 printf() 还 是 有 点 难度 的 。 真 是 让 人 心烦 气 


品 
口 口 
ZK o 


为 了 应 对 这 种 情况 ， 标 准 库 提供 了 函数 vprintf() 和 
vfprintf( )。 


void debug write(char *fmt, 
{ 
va_list ap; 
va_start(ap, fmt); 
vfprintf(stderr, fmt, ap); <-- 问 参 数 传递 ap 的 地 方 是 关键 
va_end(ap); 








只 是 ， 这 种 方法 虽然 可 以 实现 在 debug_write() 函数 中 根据 
标志 仅 在 调试 模式 时 输出 调试 信息 ， 但 还 是 无 法 避免 
debug_write() 函数 调用 的 开销 。 


如 果 是 宏 ， 就 可 以 在 编译 时 将 它 完 全 消除 ， 但 到 ANS1 5 为止 ， 
我 们 还 是 不 能 同 宏 传递 可 变 长 参数 。 


这 里 有 一 个 技巧 ， 就 是 如 下 定义 一 


#ifdef DEBUG 
#define DEBUG WRITE(arg) debug write arg 


#else 


#define DEBUG WRITE(arg) 
#endif 





然后 像 下 面 这 样 使 用 。 
DEBUG WRITE(("hoge..%d\n", hoge)); 


难点 在 于 这 里 必须 使 用 双重 括号 。 


还 有 一 种 技巧 ， 就 是 在 非 调 试 模 式 时 将 DEBUG_WRITE 定义 为 
(void)。 这 样 一 来 ， 宏 在 展开 后 就 会 变 成 (void) ("hoge. .%d\n"， 
hoge)， 它 表示 将 逗号 运算 符 连 接 的 表达 式 转 换 成 void 后 的 结果 。 
优秀 的 编译 器 会 通过 优化 将 它们 全 部 消除 。 


a Cc99 开始 ， 宏 就 可 以 采用 可 变 长 参数 了 ， 所 以 可 以 写成 下 面 


#ifdef DEBUG 
#define DEBUG WRITE(...) debug write( VA ARGS ) 


#else 
#define DEBUG WRITE(...) 
#endif 





如 果 还 想 输 出 文件 名 、 函 数 名 和 行 号 ， 可 以 写成 下 面 这 样 。 


#define DEBUG WRITE(...) \ 


(debug write("%s:%s:%d:", _FILE , _func , _LINE  ),\ 
debug write( VA ARGS )) 





_func ”是 从 C099 开始 增加 的 预定 义 标识 符 ， 表 示 〈 带 双 引 
号 的 ) 函数 名 。 另 外 ，_ FILE__ 会 在 预 处 理 中 被 置换 为 文件 名 ， 而 
_ ”LINE _ 会 被 置换 为 行 号 (这 些 是 从 ANS1 C 开始 就 有 的 功 


能 ) 。 


或 者 ， 如 果 只 是 少量 输出 ， 那 么 如 下 所 示 准 备 一 个 针对 
int、double 和 char* 的 宏 ， 可 能 会 更 加 方便 。 


#define SNAP_INT(arg) fprintf(stderr, #arg "...%d\n", arg) 


这 个 宏 可 以 像 下 面 这 样 使 用 。 


SNAP_INT(hoge); 


输出 如 下 所 示 〈 关 于 相关 原理 ， 请 查看 预 处 理 器 的 用 户 手 册 〉。 





此 外 还 有 一 点 需要 补充 。 若 是 通过 一 般 的 printf() 来 输出 调 
试 信息 ， 输 出 的 相关 信息 会 被 缓冲 ， 因 此 会 发 生 在 程序 异常 终止 等 关 
键 时 刻 无 法 输出 的 情况 。 和 若是 通过 fprintf() 将 调试 信息 输出 给 
stderr ， 或 者 输出 到 文件 ， 最 好 事先 使 用 setbuf() 函数 关闭 组 


冲 。 


* 根据 标准 ，stderr 是 无 须 进 行 缓冲 的 。 





2-5-6， 递归 调用 
C 语言 通常 将 自动 变量 的 内 存 空间 分 配 在 栈 上 。 这 样 除 了 可 以 通过 
重复 使 用 空间 来 节约 内 存 以 外 ， 还 有 一 个 重要 意义 ， 那 就 是 实现 递归 调 


用 (recursive call) 。 
所 谓 递归 调用 ， 就 是 指 函 数 调用 自己 本 身 。 
然而 ， 似 乎 许多 程序 员 对 递归 调用 感到 环 手 。 


当然 ， 递 归 本 身 比较 难 理解 是 原因 之 一 ， 不 过 我 觉得 还 有 一 个 原 
因 ， 融 是 很 多 人 不 明白 它 到 邱 有 什么 用 。 


对 于 递归 调用 ， 市 面 上 的 C 语言 入 门 书 总 会 拿 阶乘 计算 或 者 斐 波 
那 契 数 列 等 作为 例题 ， 但 我 认为 这 些 例题 是 不 合适 的 一 一 这 是 因为 用 循 
环 来 与 阶乘 更 加 简单 明了 。 


就 拿 我 遇 到 的 情况 来 说 ， 在 现实 的 程序 中 ， 需 要 使 用 递归 调用 的 情 
景 绝 大 多 数 是 对 树 形 结构 或 图 形 结构 的 遍历 。 不 过 ， 限 于 篇 幅 ， 这 里 就 
个 对 此 展开 了 。 

这 里 举 一 个 与 遍历 树 形 结构 比较 接近 的 例子 一 一 排列 的 穷 举 。 


想必 上 高 中 时 大 家 都 学 过 排列 。 所 谓 排 列 ， 就 是 从 n 个 不 同 元 素 
中 取出 r 个 元 素 并 排列 时 所 有 的 排列 方法 。 


例如 ， 从 数字 1 5 中 选取 3 个 数字 时 的 排列 为 如 下 所 示 的 60 组 





请 注意 ， 顺 序 对 排列 是 有 意义 的 。 从 上 面 的 结果 可 以 看 出 ， “1 2 
3 与 “3 2 1” 是 不 同 的 。 


下 面 我 们 编写 一 个 程序 ， 用 于 接收 n 和 r， 并 输出 所 有 的 排列 ， 
基本 的 设计 思路 如 下 所 示 〈 上 面 的 例子 也 是 基于 这 个 思路 排列 的 ) 。 


。 第 1 个 数字 从 1>n 中 任 选 即 可 。 为 了 输出 所 有 的 排列 ， 这 里 通过 
for 语句 循环 ， 依 次 使 用 1>n。 

。 第 2 个 及 其 后 的 数字 是 1>n 中 迄今 为 止 未 被 使 用 的 数字 。 

。 重 复 以 上 操作 r 次 。 


源 代码 如 代码 清单 2-9 所 示 。 


代码 清单 2-9 permutation.c 





#include <stdio.h> 


/* n 的 最 大 值 */ 
#define N MAX (1606) 


/* 知 数 字 已 被 使 用 ， 则 将 下 标 为 该 数字 的 元 素 设 成 1 */ 
int used flag[N MAX + 1]; 





cov 上 wwP 情 


9 int result[N MAX]; 
16 int n; 
11 int r; 


13 void print result(void) 
14 { 


15 int i; 


16 

17 for (i = 6; i < r; i++) { 
18 printf("%d ", result[i]); 
19 } 

20 printf("\n"); 

21 } 

22 

23 void permutation(int nth) 

24 { 

25 int i; 

26 

27 if (nth == r) { 

28 print result(); 

29 return; 

36 } 

31 

32 for (i = 1; i <= ni i++) { 
33 if (used flag[i] == 6) { 
34 result[nth] = i; 

35 used flag[i] = 1; 
36 permutation(nth + 1); 
37 used flag[i] = 8; 
38 } 

39 } 

46 } 

41 

42 int main(int argc, char **argv) 
43 { 

44 sscanf(argv[1], "%d", &n); 
45 sscanf(argv[2], "%d", &r); 
46 

47 permutation(0); 





本 程序 从 命令 行 参 数 接收 n 和 r。 在 运行 时 ， 请 像 下 面 这 样 在 命 
令 名 称 后 加 上 两 个 数字 (由 于 这 里 没有 进行 错误 检测 等 任何 检查 ， 所 以 
ed ei i in 抱歉 ， 这 里 偷 了 个 大 
懒 〉。 


> permutation 5 3 
12 
12 





在 代码 清单 2-9 的 第 44 行 和 第 45 行 中 ， 程 序 从 命令 行 参数 获 
取 n 和 r， 然 后 将 它们 赋 给 了 全 局 变量 "mn 和 r。 


”对 于 这 种 程度 的 用 途 ， 不 应 该 使 用 全 局 变量 ， 本 例 是 为 了 明确 地 确认 通过 参数 传递 


进来 的 值 ， 才 特意 使 用 了 全 局 变量 。 





第 47 行 调用 了 洱 数 permutation()。permutation() 的 参数 
nth 表示 当前 正在 处 理 第 几 个 数字 起 始 数 字 计 为 第 0 个 ) 。 


由 于 初次 调用 permutation() 函数 时 nth 为 6， 所 以 程序 执行 
不 会 卡 在 第 27 行 的 if 语句 ， 而 会 进入 第 32 行 " 第 39 行 的 for 
循环 中 。 这 里 决定 了 第 nth 个 数字 的 值 。 由 于 已 使 用 的 数字 会 在 数组 
used_flag 中 设立 标志 ， 所 以 这 里 程序 将 通过 第 33 行 的 if 语句 ， 
然后 在 第 34 行将 数字 设置 到 保存 结果 的 result 数组 中 ， 在 第 35 
行 设立 已 使 用 标志 。 随 后 ， 在 第 36 行 调用 permutation() 函数 ， 即 
调用 自身 。 这 就 是 递归 调用 。 


在 进行 递归 调用 时 传递 了 nth + 1 作为 参数 ， 因 此 接 下 来 就 要 对 
result 数组 的 下 一 个 元 素 进行 设置 了 。 然 后 ， 当 nth 等 于 r 时 ， 通 
过 print_result() 函数 输出 当前 的 result 并 返回 。 


上 述 过 程 可 以 用 图 2-11 说 明 。 为 了 避免 图 形 过 大 ， 这 里 给 出 的 是 
当 n 和 fr 为 3 时 的 情况 。 


1=37=3 的 情况 
nth = 0 nth = 1 nth = 2 nth = 3 


CLLELEELELELEL 


nme 


] 一 | -一 一 it result1 


[ na 


We 
rain()— | 人 
一 一 一 
0 -一 print result |) 


这 个 方 框 表示 。。 在 除去 已 使 用 的 数 
for 循 环 字 后 继续 for 特 环 


图 2-11 排列 的 穷 举 


这 种 方式 之 所 以 能 够 实现 ， 是 由 于 函数 permutation() 中 的 局 部 
变量 i 与 参数 nth 被 分 配 在 栈 中 了 。 因 为 nth = 6 时 的 i 与 nth 
= 1 时 的 i 分 别 保存 在 不 同 的 内 存 空间 中 ， 所 以 从 递归 调用 返回 时 
for 循环 能 够 继续 下 去 。 


对 于 这 样 的 程序 ， 要 是 不 使 用 递归 来 写 ， 就 会 比较 麻烦 。 
请 大 家 气 弃 偏见 ， 去 习惯 使 用 递归 。 
2-5-7 099 中 的 可 变 长 数组 (VLA) 的 栈 
如 1-4-8 节 所 述 ，0998 具备 VLA 功能 ， 可 以 使 自动 变量 的 数组 可 


ar 4 

那么 ， 为 什么 只 有 自动 变量 可 以 使 用 VLA 呢 ? 那 是 因为 自动 变量 
是 被 分 配 到 栈 中 的 。 与 具有 静态 存储 区 的 变量 不 同 ， 栈 在 运行 时 可 以 延 
伸 ， 所 以 我 们 就 可 以 在 栈 上 配置 可 变 长 数组 。 


1-4-8 节 的 代码 清单 1-11 展示 了 VLA 的 示例 程序 ， 下 面 对 其 稍 
加 修改 ， 以 输出 数组 和 局 部 变量 的 地 址 。 修 改 后 的 示例 程序 如 代码 清单 
2-10 所 示 ， 其 中 省 略 了 实际 对 该 数组 设 值 的 部 分 和 输出 的 部 分 。 另 
外 ， 为 了 能 够 看 到 除数 组 外 的 局 部 变量 的 配置 ， 这 里 增加 了 


var1、var2 和 var3。 


三 


代码 清单 2-10 vla2.c 





1 #include <stdio.h> 
2 
3 void sub(int size1l, int size2, int size3) 


44 

5 int varil; 
6 int arrayl[sizel1]; 
7 
8 


int var2; 

int array2[size2][size3]; 
9 int var3; 
10 
11 printf("array1..%p\n", (void*)array1); 
12 printf("array2..%p\n", (void*)array2); 
13 printf("&var1..%p\n", (void*)&varl); 
14 printf("&var2..%p\n", (void*)&var2); 
15 printf("&var3..%p\n", (void*)&var3); 
16 } 


18 int main(void) 





19 { 

20 int size1l, size2, size3; 

21 

22 printf(" 请 输入 3 个 整数 \n"); 

23 scanf("%d%d%d", &sizel, &size2, &size3); 
24 

25 sub(size1l, size2, size3); 

26 } 





运行 结果 如 下 所 示 。 


请 输入 3 个 整数 

3 4 5 

array1. .9Xx7fff63fe85c6 
array2. .9Xx7fff63fe8566 
&var1. .6x7fff63fe861c 

&var2. .0Xx7fff63fe8626 

&var3. .60x7fff63fe8624 





如 果 用 图 说 明 ， 则 如 图 2-12 所 示 。 


Ox7fff63fe8560 


array2 


Ox7fff63fe85c0 


arrayl 


Ox7fff63fe861c 
Ox7fff63fe8620 
Ox7fff63fe8624 





图 2-12 VLA 的 内 存 配 置 


由 于 VLA 的 数组 是 可 变 长 的 ， 所 以 图 2-12 中 的 Me 和 
array1 的 长 度 会 在 运行 时 发 生变 化 。 这 就 意味 着 ， 我 们 无 法 通过 2- 


5-3 节 提 到 的 “参照 距离 基 指 针 固定 长 度 的 位 置 ” 的 方法 访问 局 部 变 
量 。 实 际 上 ， 在 代码 清单 2-10 中 “请 输入 3 个 整数 ”处 输入 不 同 的 
值 之 后 ， 变 量 之 间 的 间隔 发 生 了 变化 。 

请 输入 3 个 整数 


567 
array1. .9Xx7fffe268d356 


array2..6x7fffe268d2a0 
&var1. .9x7fffe268d3bc 
&var2. .9x7fffe268d3c6 
&var3. .9x7fffe268d3c4 





为 了 在 这 种 状态 下 访问 局 部 变量 ， 编 译 器 会 生成 一 段 能 够 在 运行 时 
确认 sizel、size2 和 size3 的 值 并 使 参考 位 置 错开 的 代码 。 


2-6-1 malloc() 的 基础 知识 
在 C 语言 中 ， 可 以 使 用 malloc() 进行 动态 内 存 分 配 。 


malloc() 是 根据 参数 指定 的 大 小 分 配 内 存 块 ， 并 返回 指向 该 内 存 
块 起 始 位 置 的 指针 的 函数 ， 用 法 如 下 所 示 。 


在 内 存 分 配 失 败 〈 内 存 不 足 ) 的 情况 下 ，malloc() 返回 NULL。 


对 于 利用 malloc() 分 配 的 内 存 ， 需 要 如 下 所 示 在 使 用 结束 后 通 
过 free() 释放 。 


free(p); “-- 释放 p 指 向 的 内 存 空 间 





以 上 就 是 malloc() 的 基本 用 法 。 


像 这 样 动 态 地 〈 在 运行 时 ) 分 配 ， 并 可 以 按 任意 顺序 释放 的 存储 空 
间 ， 通 常 称 为 堆 * (heap) 。 


” 堆 不 是 5 语言 规范 中 定义 的 术语 。 





在 英语 中 ，heap 是 指 堆积 如 山 的 事物 干草 等 ) 。malloc() 用 
于 从 这 座 内 存 的 高 山中 分 取 内 存 ， 从 这 个 意义 上 来 说 ， 它 就 是 “从 堆 中 
获取 内 存 空 间 的 函数 ”。 


malloc() 的 主要 使 用 场景 如 下 所 示 。 
)1. 动态 分 配 结构 体 
爱 书 之 人 可 能 会 想 用 计算 机 管理 自己 的 书 。 因 为 他 们 常常 在 把 
书 从 书店 买 回 来 之 后 才 发 现 “ 啊 ! 原来 这 本 书 我 已 经 有 了 ! ”特别 
是 漫画 书 ， 常 常 由 于 搞 不 清 自己 到 底 已 经 买 了 几 卷 而 重复 购买 ， 不 
是 吗 ? 〈 什 么 ? 只 有 我 是 这 样 ? ) ” 


”所 以 ， 我 现在 都 买 电子 书 。 


出 于 以 上 原因 ， 我 打算 做 一 个 “藏书 管理 程序 ”。 


假设 用 如 下 的 结构 体 BookData 管理 一 本 书 的 数据 ， 那 么 书 
虫 们 就 需要 管理 大 量 的 BookData。 


typedef struct { 
char title[64]; /* 书 名 */ 
int price; /* 价格 */ 
char isbn[32]; /* ISBN */ 


} BookData; 





在 这 种 情况 下 ， 虽 然 使 用 庞大 的 数组 来 大 量 保 存 BookData 
也 可 以 ， 但 在 5 语言 中 必须 为 数组 指定 明确 的 长 度 ， 那 么 到 底 把 
长 度 指 定 为 多 少 才 好 呢 ? 这 真是 令 人 头疼 。 如 果 随 意 分 配 一 个 庞大 
的 数组 ， 会 滔 费 内 存 ， 但 如 果 分 配 的 数组 长 度 刚 刚好 ， 那 么 一 旦 书 


增多 了 ， 数 组 内 存 又 会 不 足 。 虽 说 C99 提供 了 VLA， 但 VLA 只 能 
用 于 自动 变量 ， 而 且 不 能 改变 大 小 ， 因 此 VLA 在 这 个 场景 下 根本 
派 不 上 用 场 。 


此 时 ， 可 以 使 用 如 下 写法 实现 在 运行 时 动态 分 配 BookData 
的 内 存 空 间 。 


BookData *book data p; 





/* 分 配 相当 于 一 个 结构 体 BookData 的 内 存 空间 */ 
book data_p = malloc(sizeof(BookData) ) ; 





如 果 使 用 链表 (1inked 1ist) 等 数据 结构 管理 这 些 数 据 ， 就 
可 以 保存 任意 数量 的 BookData 了 。 当 然 这 仅 限 于 内 存 足 够 的 情 
况 。 


关于 链表 等 数据 结构 的 用 法 ， 第 5 章 会 详细 说 明 ， 所 以 这 里 
只 简单 说 明 一 下 。 


首先 ， 向 结构 体 BookData 添加 如 下 所 示 的 指向 BookData 
类 型 的 指针 作为 成 员 。 


typedef struct BookData tag { 
char title[64]; /* 书 名 */ 
int price; /* 价格 */ 
char isbn[32]; /* ISBN */ 


struct BookData tag *next; 
} BookData; 





另外 ， 在 本 例 中 ，struct BookData_tag 结构 体 被 
typedef 成 了 BookData (为 了 可 以 不 用 每 次 都 要 写 上 
struct) ， 但 要 注意 ， 在 声明 成 员 next 的 时 间 点 ，typedef 还 
没有 完成 ， 所 以 这 里 必须 写成 struct BookData tag。 


然后 ， 在 这 个 next 中 保存 指向 下 一 个 BookData 的 指针 ， 
并 像 图 2-13 那样 连 成 一 串 ， 就 可 以 保存 大 量 的 BookData 了 
图 中 国 一 的 部 分 表示 指针 ， 男 凶 的 部 分 表示 
NULL) 。 


人 


最 后 设置 为 
NULL 


图 2-13 ”链表 
这 就 是 被 称 为 链表 的 数据 结构 ， 其 应 用 十 分 广泛 。 
)2. 为 到 运行 时 才能 确定 长 度 的 数组 分 配 内 存 
在 刚才 的 BookData 类 型 中 ， 书 名 的 地 方 写 成 了 下 面 这 样 。 


char title[64]; /* 书 名 */ 


但 有 时 我 们 也 会 遇 到 一 些 相当 长 的 书 名 ， 例 如 下 面 这 种 书 
名 。 
* 我 真 的 没有 读 过 一 本 这 种 轻 小 说 。 


我 的 妹妹 明明 这 么 可 爱 可 我 的 朋友 那么 少 所 以 我 的 青春 恋爱 


喜剧 果然 有 问题 


”这 是 作者 根据 三 部 日 本 著名 轻 小 说 杜撰 的 超 长 书 名 。 一 一 译 者 注 





char title[64]; 放 不 下 这 么 长 的 书 名 ， 但 也 并 非 所 有 书 名 


都 这 么 长 ， 所 以 准备 太 长 的 数组 也 是 浪费 。 
这 里 可 以 将 title 的 声明 写成 下 面 这 样 。 


然后 就 可 以 像 下 面 这 样 根据 需要 给 书 名 字符 串 分 配 内 存 空间 
了 。 像 这 样 动态 分 配 的 数组 ， 在 本 书 中 称 为 动态 数组 。 


BookData *book data p; 





/* 此 处 ，len 是 书 名 的 字符 个 数 ，+1 是 空 字符 的 长 度 */ 
book data p->title = malloc(sizeof(char) * (len + 1)); 





这 了 时， 如 果 想 要 引用 title 中 某 个 特定 字符 ， 当 然 就 可 以 写 
成 book_data _p->title[i] 这 样 了 。 因 为 p[i] 是 *+(p + i) 
的 语法 糖 。 


补充 应 该 强制 转换 mal1oc () 的 返回 值 类 型 吗 


由 于 ANSI 0 之 前 的 6 语言 中 没有 void* 这 种 类 型 ， 所 以 方 
上 malloc() 的 返回 值 类 型 被 定义 为 char*+ 了 。 因 为 char* 

能 赋 给 指向 其 他 类 型 的 指针 变量 ， 所 以 在 使 用 malloc() 时 ， 必 
a te 


book data p = (BookData*)malloc(sizeof(BookData)); 


在 ANS1 C 中 ，malloc() 的 返回 值 类 型 变 成 了 void*， 而 
void* 类 型 的 指针 可 以 不 经 转换 就 赋 给 〈 除 函数 指针 以 外 的 ) 所 有 
类 型 的 指针 变量 。 因 此 ， 像 上 面 这 样 的 转换 在 现 如 今 是 不 需要 的 。 


管 如 此 ， 现 在 似乎 也 经 常 有 人 与 这 种 转换 。 我 觉得 ， 不 与 多 余 
的 转换 处 理 者 E 使 代码 更 加 清晰 易 读 。 


另外 ， 假 如 在 忘记 扩 nclude 头 文件 stdlib.h 的 情况 下 ， 不 
慎 对 返回 值 进行 了 类 型 转换 ， 编 译 器 就 很 有 可 能 无 法 报 出 警告 。 





由 于 5 语言 默认 将 没有 声明 的 函数 的 返回 值 解释 为 int 类 型 
“， 所 以 即使 现在 程序 碰巧 能 够 跑 得 起 来 ， 一 旦 被 放 到 int 与 指针 的 
长 度 不 同 的 运行 环境 中 ， 也 会 无 法 运行 。 


了 ”如 果 可 能 ， 应 该 提高 编译 器 的 警告 级 别 ， 以 便 编译 器 能 够 在 这 种 情况 下 报 出 警 


因此 ， 请 不 要 再 对 malloc() 的 返回 值 进行 类 型 转换 了 。 因 为 
C 不 是 C++。 


另外 ， 在 C++ 中 ， 我 们 虽然 可 以 将 任意 的 指针 赋 给 void* 类 
型 的 变量 ， 但 无 法 将 void* 类 型 的 值 赋 给 普通 的 指针 类 型 变量 。 
此 ， 如 果 是 在 C++ 中 ， 就 有 必要 对 malloc() 的 返回 值 进行 类 型 转 
1 但 在 C++ 中 ， 通 常 是 使 用 new 来 动态 分 配 内 存 的 〈 也 应 该 这 





2-6-2 malloc() 是 系统 调用 吗 
这 里 说 一 点 题 外 话 。 


0 语言 的 标准 库 为 我 们 准备 了 众多 函数 (printf() 等 ) 。 而 标准 
库 函 数 中 的 一 部 分 最 终 会 调用 系统 调用 “。 所 谓 系统 调用 ， 是 指 要求 操 
作 系 统 帮 我们 去 执行 茶 些 操作 的 特别 的 函数 集 。 虽 然 标准 库 依据 1S0 
标准 进行 了 标准 化 ， 但 在 不 同 的 操作 系统 上 ， 系 统 调用 却 常常 不 同 。 


* 这 原本 是 UNIX 的 术语 。 





例如 ， 在 UNIX 中 ，printf() 最 终 会 调用 称 为 write() 的 系统 
调用 。 不 只 是 printf()，putchar() 和 puts() 最 终 调 用 的 也 是 


write()。 


由 于 write() 只 具备 输出 指定 字 市 串 的 功能 ， 所 以 为 了 便于 应 用 
程序 程序 员 使 用 ， 也 为 了 兼顾 可 移植 性 ，5 语言 为 它 庄 上 了 标准 库 


的 “外 壳 ?” 


”使 用 标准 输入 输出 函数 集 还 有 一 个 目的 ， 即 通过 缓冲 提高 效率 。 





那么 ，malloc() 到 放 是 系统 调用 ， 还 是 标准 库 函 数 呢 ? 


可 能 很 多 人 党 得 它 是 系统 调用 。 但 实际 上 ，malloc() 是 标准 库 洛 
数 ， 并 不 是 系统 调用 。 


要 点 


malloc() 不 是 系统 调用 。 





2-6-3 malloc() 中 发 生 了 什么 


在 大 多 数 的 实现 中 ，malloc() 是 先 从 操作 系统 那里 一 次 性 获取 大 
量 内 存 ， 再 把 它 “零售 ” 分 发 ) 给 应 用 程序 的 。 


根据 操作 系统 的 不 同 ， 从 操作 系统 获取 内 存 的 手段 也 多 种 多 样 。 在 
UNIX 中 ， 需 要 利用 称 为 brk()* 的 系统 调用 。 


* 它 是 break 的 缩 略 形式 。 


请 回想 一 下 ， 在 图 2-3 中 ，“ 通 过 malloc() 分 配 的 内 存 空 


间 ” 的 下 方 空 出 了 一 大 块 空间 。 系 统 调用 brk() 就 是 一 个 通过 对 
malloc() 用 的 内 存 空间 的 末尾 地 址 进行 设置 来 伸缩 内 存 空间 的 函数 。 


每 调用 若干 次 malloc()， 就 需要 调用 一 次 brk()， 以 扩大 内 存 空 
间 。 


可 能 有 人 会 产生 下 面 这 种 想法 


咽 ? 如 果 用 这 种 方法 ， 就 算 能 够 实现 内 存 空间 的 分 配 ， 也 无 法 按 


任意 顺序 释放 吧 ? 不 是 吗 ? 





确实 如 此 。 


看 我 这 么 说 ， 大 家 肯定 会 想 : “那么 free() 又 是 什么 呢 ? ”有 
这 个 疑问 很 正常 。 下 面 我 们 看 一 下 malloc() 和 free() 的 基本 原 
型 。 


现实 中 的 malloc() 函数 为 了 改善 效率 费 了 很 大 一 番 工 夫 。 这 里 
我 们 看 一 下 其 中 最 单纯 的 实现 方式 ， 即 通过 链表 实现 。 


顺便 说 一 下 ，K&R 中 也 记载 了 通过 链表 实现 malloc() 的 示例 程 
序 。 


朴素 的 实现 方式 就 如 图 2-14 所 示 : 在 各 个 块 的 开头 加 上 管理 区 
域 ， 然 后 通过 管理 区 域 构建 链表 。 














若 内 存 空间 不 足 ， 
则 向 操作 系统 请 求 扩充 
图 2-14 通过 链表 实现 malloc() 的 示例 


malloc() 会 遍历 链表 ， 搜 寻 空 块 ， 若 该 块 大 小 足够 ， 就 将 其 分 割 
出 来 ， 做 成 使 用 中 的 块 ， 并 向 应 用 程序 返回 紧邻 管理 区 域 的 下 一 个 地 
址 。free() 会 改写 管理 区 域 的 标志 ， 将 该 块 置 为 空 块 ， 如 果 上 下 有 衬 
块 ， 就 顺便 将 它们 合并 成 一 个 块 "。 这 是 为 了 防止 块 碎片 化 。 


* 这 种 操作 称 为 coalescing。 





当 没有 足够 大 的 空 块 满足 malloc() 的 要 求 时 ， 就 向 操作 系统 请 
求 〈 在 UNIX 中 需要 通过 brk() 系统 调用 ) 扩充 内 存 空间 。 


那么 ， 在 采用 这 种 方针 管理 内 存 的 运行 环境 中 ， 如 果 数 组 边 珊 检 查 


有 误 ， 向 超过 malloc() 分 配 的 内 存 空间 执行 了 写 入 ， 又 会 发 生 什么 
呢 ? 


在 这 种 情况 下 ， 下 一 个 块 的 管理 区 域 会 遭 到 损坏 ， 所 以 今后 调用 
malloc() 或 free() 时 程序 骨 溃 的 概率 会 很 高 。 这 种 时 候 可 别 因 为 














程序 是 死 在 了 malloc() 中 ， 就 大 喊 “ 这 是 库 的 Bug ! ” 文 / 
只 会 自 讨 没 趣 。 

首先 ， 现 实 中 根本 没有 一 个 运行 环境 用 这 么 单纯 的 方针 实现 
malloc( )。 


例如 ， 内 存 管理 方法 除了 这 里 所 说 的 链表 方式 以 外 ， 伙 伴 系统 
(buddy system) 也 是 一 种 广为人知 的 方法 。 该 方法 将 大 块 内 存 逐 步 对 
半分 割 ， 虽 然 速度 很 快 ， 但 内 存 使 用 效率 会 变 


另外 ， 让 管理 区 域 与 传递 给 应 用 程序 的 区 域 邻 接 也 是 很 危险 的 ， 因 
此 有 的 实现 方式 会 将 它们 放置 在 相隔 很 远 的 位 置 。 


或 者 ， 即 便 是 使 用 链表 实现 ， 如 果 按 内 存 空间 大 小 分 别 通 过 其 他 链 
表 来 管理 ， 也 能 够 快速 搜寻 所 需 大 小 的 块 。 


不 过 ， 这 里 大 家 记 住 “malloc() 绝 不 是 什么 魔法 函数 ” 即 可 。 


随 着 CPU 和 操作 系统 的 不 断 进步 ， 说 不 定 malloc() 将 来 可 以 成 
为 魔法 函数 ， 但 现在 我 们 还 不 能 把 它 看 作 魔 法 函数 。 


如 果 对 malloc() 的 原理 一 无 所 知 ， 写 出 的 程序 就 经 常会 无 法 调 
试 或 者 效率 超 低 。 


如 果 你 想 使 用 malloc()， 就 请 先 充 分 理解 它 ， 不 然 会 很 危险 。 


要 点 


malloc() 绝 不 是 什么 魔法 函数 。 





2-0-4 free () 之 后 相应 的 内 存 空 国会 怎 样 


如 前 所 述 ， 在 大 多 数 的 实现 中 ，malloc() 对 从 操作 系统 一 次 性 获 
取 的 内 存 进行 管理 ， 然 后 “零售 ”给 应 用 程序 。 


因此 ， 在 一 般 情 况 下 ， 在 调用 free() 之 后 ， 相 应 的 内 存 空间 并 
会 立刻 返还 给 操作 系统 。 不 仅 如 此 ， 即 使 执行 了 free()， 在 大 多 数 
时 候 也 还 是 能 够 看 到 free ) 之 前 设置 的 值 (实际 青 况 因 运 行 环境 而 


异 *) 。 


”在 我 的 环境 中 ， 初 始 的 几 个 字 节 会 遭 到 损坏 。 





令 人 琼 手 的 是 ， 在 free() 之 后 ， 对 应 的 内 存 内 容 并 不 会 立刻 被 
破坏 ， 这 一 特性 会 使 调试 时 的 原因 调查 举步维艰 。 


如 图 2-15 所 示 ， 假 设 两 个 指针 引用 了 同一 块 内 存 空间 。 
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图 2-15 假设 同一 块 内 存 空 间 被 两 个 指针 引用 ...…... 


那么 ， 假 如 在 利用 指针 A 引用 该 内 存 空间 的 地 方 ， 程 序 
经 不 再 需要 这 块 内 存 空间 了 ， 于 是 冒 冒失 失 把 它 给 free() 了 ， 
远离 当前 代码 的 另 一 处 ， 还 有 一 段 代码 正在 通过 指针 B 3 用 该 内 存 宇 


间 。 在 这 种 情况 下 ， 会 发 生 什么 呢 ? * 


| 





这 时 可 以 说 问题 在 于 过 早 地 调用 了 free()， 但 即使 执行 了 
free()， 指针 B 所 引用 的 内 容 也 不 一 定 立 刻 就 被 损坏 ， 所 以 暂时 还 是 
可 以 看 到 与 之 前 相同 的 值 。 直到 其 他 地 方 执行 了 malloc()， 使 该 内 存 

空间 被 占用 时 ， 内 存 空间 中 的 内 容 才 会 被 损坏 。 这 种 Bug 从 问题 产生 
到 Bug 被 发 现 经 历 的 时 间 较 长 ， 会 给 调试 带 来 很 大 困难 。 


若是 大 型 项 目 ， 或 许可 以 通过 以 下 方法 避免 这 样 的 问题 : 给 
free() 加 一 层 壳 写 成 函数 ， 且 让 程序 员 只 能 调用 该 函数 ， 然 后 在 释放 
内 存 空间 之 前 故意 将 该 空间 内 的 数据 破坏 掉 〈 填 充 诸如 6xCC 这 样 无 意 
义 的 值 ) 。 然 而 ， 遗 憾 的 是 ， 指 针 没有 办 法 获知 它 所 指向 的 内 存 空 间 的 
大 小 ， 所 以 我 们 想 这 么 做 也 做 不 成 "<。 要 想 获取 内 存 空 间 的 大 小 ， 可 以 
给 malloc() 也 加 上 一 层 壳 ， 然后 在 每 次 分 配 内 存 空 s 间 时 稍微 多 分 配 
一 点 ， 以 便 在 该 内 存 空 间 的 起 始 部 分 保存 内 存 大 小 信息 。 


”如 果 是 通过 malloc() 分 配 的 内 存 ， 那 么 标准 库 肯 定 是 知道 其 大 小 的 ， 但 遗憾 的 


是 ， 现 阶段 的 5 语言 标准 中 并 没有 可 以 查询 其 大 小 的 函数 。 





如 果 将 程序 设计 成 在 编译 时 去 掉 调 试 选 项 就 能 去 除 这 些 代 码 ， 那 么 
发 行 版 的 程序 就 不 会 出 现 执行 效率 低下 的 问题 。 


这 么 做 虽然 挺 麻 烦 ， 但 对 于 大 型 程序 来 说 还 是 非常 有 效 的 。 
另外 ， 在 SU 等 系统 中 使 用 的 标准 库 glibc 的 malloc() 


中 ， 如 果 将 环境 变量 MALLOC_PERTURB 设置 成 非 0 的 值 ， 那 么 在 执行 


free() 之 后 ， 程 序 就 会 使 用 这 个 值 破坏 该 内 存 空间 的 数据 。 如 果 大 家 
使 用 的 环境 中 有 这 样 的 功能 ， 不 妨 利用 一 个 。 


”不 过 我 试 了 一 下 ， 发 现 它 并 没有 一 直 填 充 到 内 存 空 间 的 最 后 





补充 Valgrind 


正如 前 面 多 次 提 到 的 那样 ， 与 动态 内 存 分 配 相关 的 Bug 往 往 出 现 
在 距离 它 被 发 现 的 位 置 很 远 的 地 方 ， 因 此 调试 非常 困难 。 


在 Linux 上 可 以 使 用 Valgrind 工 具 追 中 这 类 Bug。Valgrind 工 具 用 
于 检测 对 malloc( ) 分 配 的 内 存 空间 越界 读 写 、 忘 记 free()〔( 内 存 港 
漏 ) 或 者 对 同一 块 内 存 空间 多 次 free( )* 这 类 问题 。 


* 如 果 运 气 好 ， 标 准 库 glibc 也 可 以 为 我 们 检测 出 这 个 问题 。 


将 测试 目标 程序 按 如 下 方式 启动 ， 即 可 进行 检测 。 
$ valgrind --leak-check=full 测试 目标 程序 该 程序 的 参数 
对 于 很 久 以 前 为 了 追踪 这 类 Bug 而 费 尽 周折 的 劳苦 大 众 来 说 ， 能 


够 免费 使 用 这 么 优秀 的 工具 是 何等 方便 啊 ， 简 直 令 人 感动 ! 进行 
Linux 开 发 的 各 位 请 务必 尝试 使 用 一 下 。 





2-6-5 ”碎片 化 

假设 某 个 运行 环境 中 的 malloc() 是 通过 类 似 于 2-6-3 节 的 方法 
实现 的 ， 那 么 如 果 以 随机 顺序 反复 地 分 配 和 释放 各 种 大 小 的 内 存 ， 会 发 
生 什么 问题 呢 ? 


在 这 个 过 程 中 ， 内 存 将 变 得 零 零碎 碎 ， 出 现 许多 细碎 的 空 块 ， 而 这 
样 的 内 存 空间 事实 上 是 无 法 使 用 的 。 


这 种 现象 就 称 为 碎片 化 (fragmentation) (图 2-16) 。 


xX 
像 这 样 小 的 空 
X 块 ， 事实 上 是 
无 法 使 用 的 
XxX 
xX 


图 2-16 碎片 化 


移动 内 存 块 ， 使 之 与 前 面 的 块 相 结合 ， 应 该 就 可 以 将 细 寿 的 内 存 空 
间 集 合成 大 块 的 内 存 空 间 。 但 是 ， 由 于 5 语言 中 《虚拟 ) 地 址 是 直接 
传递 给 应 用 程序 的 ， 所 以 库 无 法 随意 移动 内 存 空间 。 


”这 种 操作 称 为 compaction。 





在 C 语言 中 ， 只 要 使 用 malloc() 这 样 的 内 存 管理 例 行 程序 
(memory management routine) ， 就 无 法 从 根本 上 避免 碎片 化 的 问 
题 。 但 我 们 可 以 在 realloc() 的 用 法 上 做 点 文章 (2-6-6 节 ) ， 使 情 

况 得 以 改善 。 
2-6-6 malloc() 以 外 的 动态 内 存 分 配 函 数 


说 到 malloc() 以 外 的 动态 内 存 分 配 函 数 ， 首 先是 calloc()。 


#include <stdlib.h> 
void *calloc(size t nmemb, size t size) 


calloc() 通过 与 malloc() 相同 的 方法 ， 仅 分 配 nmemb x 
size 的 内 存 空 间 ， 并 将 该 内 存 空 间 清 零 返 回 。 也 就 是 说 ，calloc() 
和 以 下 代码 是 一 个 意思 《但 实现 不 一 定 相同 ) 。 


memset(p, 8, nmemb * size); 

有 人 或 许 党 得 “能 帮 着 清 零 啊 ， 那 还 是 用 这 个 函数 方便 ! ”但 这 里 
的 清 零 说 到 底 只 是 将 该 内 存 空间 的 全 部 位 置换 成 0 而 已 。 这 种 方法 就 
算 可 以 使 整数 变 成 0， 也 未 必 能 够 使 double 或 者 float 这 种 浮 点 数 
的 值 也 变 成 0， 指 针 也 未 必 会 变 成 空 指 针 。 不 过 ， 在 现在 的 大 多 数 运行 
环境 中 ， 浮 点 数 的 值 会 变 成 0， 指 针 也 会 变 成 空 指 针 ， 但 考虑 到 可 移植 
性 ， 这 样 做 只 会 让 问题 变 得 更 复杂 。 因 为 这 会 市 来 以 下 新 问题 : 在 自己 
的 环境 里 能 运作 ， 可 是 一 放 到 别 的 环境 里 就 跑 不 动 了 。 


malloc() 无 法 保证 其 所 分 配 的 内 存 中 的 内 容 。 前 一 次 的 
malloc() 中 用 过 的 数据 很 可 能 作为 垃圾 数据 残留 下 来 。 这 样 一 来 ， 由 
于 我 们 不 知道 那些 筷 记 执行 初始 化 的 内 存 空间 中 到 底 有 什么 数据 ， 所 以 
就 会 出 现 “ 时 而 能 运行 时 而 不 能 运行 ”这 种 难以 重 现 的 Bug。 这 类 Bug 
非常 环 手 ， 因 此 应 该 使 用 calloc( ) 一 一 这 种 说 法 看 上 去 没 错 ， 但 如 果 
是 我 ， 就 会 选择 目 己 给 malloc() 加 个 壳 ， 不 进行 清 霍 ， 而 是 填充 
6xCC 这 种 无 意义 的 值 。 这 种 做 法 更 有 利于 从 那些 没 好 好 进行 初始 化 的 
程序 中 准确 地 找 出 Bug。 


我 还 曾 听 到 过 下 面 这 种 不 知 所 谓 的 说 法 : “calloc() 连结 构 体 的 
填充 部 分 〈 下 面 会 讲 ) 也 一 起 给 清 零 了 ， 真 是 让 人 心情 舒畅 ! ”那些 没 
人 在 意 的 填充 部 分 ， 就 算 被 清 零 了 又 怎样 呢 ? 


话说 回来 ，calloc() 以 “ 块 的 个 数 ” 和 “ 块 的 大 小 ”为 参数 ， 而 
后 将 它们 相 乘 ， 以 得 出 的 字 节 数 为 大 小 获取 内 存 。 但 是 ， 一 旦 这 个 乘法 
运算 引发 整数 洪 出 ， 实 际 分 配 的 内 存量 就 会 比 预 想 的 要 小 。 堆 中 也 可 能 
发 生 缓冲 区 溢出 漏洞 ”， 进 而 演变 成 安全 漏洞 。 近 来 calloc() 的 实现 
已 经 开始 对 这 个 溢出 进行 检查 了 *。calloc() 相对 于 malloc() 的 优 
点 ， 大 概 就 是 这 一 点 。 


” 挫 中 发 生 的 缓冲 区 溢出 漏洞 比 栈 中 的 更 难 定位 。 





”在 我 的 环境 中 ， 返 回 的 是 NULL。 





除 此 之 外 ， 虽 然 malloc() 和 calloc() 返回 的 必须 是 进行 了 对 

齐 处 理 (2-7 节 ) 的 地 址 ， 但 当 “ 块 的 个 数 ” 是 个 很 大 的 数 ， 而 “ 块 的 

大 小 假设 为 1 时 ，calloc() 的 限制 相对 较 宽 松 ， 这 或 许 也 可 以 说 
它 的 优点 。 不 过 ， 我 从 未 在 现实 中 见 过 这 样 的 运行 环境 。 


接 下 来 ， 我 们 看 一 下 另外 一 个 动态 内 存 分 配 函 数 realloc()。 
一 个 用 于 更 改 已 由 malloc() 分 配 的 内 存 空 间 大 小 的 函数 。 


#include <stdlib.h> 
void *realloc(void *ptr, size t size); 


realloc() 将 ptr 指向 的 内 存 空间 大 小 改 为 size， 并 返回 指向 
新 内 存 空 间 的 指针 。 


话 虽 如此， 但 就 如 同 前 面 所 说 ，malloc() 本 身 并 不 是 什么 魔法 函 
数 ，realloc() 也 一 样 。realloc() 通常 用 于 扩充 内 存 空间 ， 如 果 由 
ptr 传递 过 来 的 内 存 空间 的 后 面 刚好 存在 所 需 的 空闲 空间 ， 那 么 或 许 会 
就 这 么 直接 扩充 *。 但 如 果 后 面 没 有 足够 的 空 闪 空间 ， 就 会 在 别处 分 配 
新 的 内 存 空间 ， 然 后 将 内 容 复 制 过 去 。 


”这 一 点 不 保证 。 有 时 也 会 遇 到 这 种 情况 : 明明 是 缩小 内 存 空间 ， 结 果 返 回 的 却 是 与 


以 前 不 同 的 指针 。 





我 们 经 常 需要 对 数组 依次 追加 数据 ， 如 果 每 追加 一 个 元 素 就 用 
realloc() 扩充 一 次 内 存 空间 ， 会 发 生 什 么 呢 ? 


如 果 运 气 好 ， 后 面 正 好 有 空闲 空间 ， 那 还 算 好 ， 人 否则 就 需要 频繁 地 
复制 内 存 空 间 ， 而 这 会 导致 运行 效率 低下 。 而 且 ， 不 断 地 反复 进行 内 存 
分 配 和 释放 ， 也 会 引发 内 存 碎片 化 。 


为 减少 这 种 问题 ， 不 妨 使 用 这 样 的 手法 : 例如 以 100 个 元 素 为 单 
位 ， 当 内 存 不 足 时 ， 一 次 性 进行 扩充 。 不 过 ， 如 果 采 用 这 样 的 做 法 ， 
当 要 扩充 的 内 存 空间 非常 巨大 时 ， 就 会 造成 复制 时 间 和 堆 空 间 的 浪费 。 


”也 可 以 不 按 固定 大 小 扩充 ， 而 以 当前 大 小 的 固定 倍数 扩充 。 一 般 来 说 ， 这 种 方式 的 


效率 更 令 人 满意 。 





如 果 想 要 动态 地 为 大 量 元 素 分 配 内 存 空间 ， 那 么 最 好 不 要 使 用 连续 
的 内 存 空间 ， 建 议 使 用 链表 这 类 手法 。 


要 点 
使 用 realloc() 时 请 谨慎 。 





另外 ， 如 果 向 realloc() 的 ptr 传递 NULL， 那 么 realloc() 
的 行为 将 与 malloc() 完全 相同 。 


因此 ， 对 于 偶尔 会 看 到 的 如 下 代码 ， 


if (p == NULL) { 
p = malloc(size); 
} else { 
p = realloc(p, size); 


} 





我 们 完全 可 以 将 它 写 成 下 面 这 样 〈 暂 且 不 论 返 回 NULL 时 的 情况 
的 本 


”如 果 采 用 这 种 写法 ， 当 realloc() 返回 NULL 时 ， 会 出 现 p 永久 丢失 的 问题 。 





p = realloc(p, size); 


补充 malloc (参数 为 0 


当 malloc() 的 参数 为 0 时 ， 根 据 C 语 言 标准 ， 运 行 环境 中 的 定义 
可 以 从 以 下 两 个 动作 中 任 选 一 个 。 


。 返回 空 指针 
。 采取 与 参数 非 0 时 相同 的 动作 


后 者 的 说 明 让 人 费解 ， 但 其 实 它 的 意思 就 是 不 对 malloc(6) 进 行 
特殊 处 理 ， 直 接 返 回 大 小 为 0 的 内 存 空间 。 实 际 上 ， 数 据 个 数 “ 础 
巧 ”为 0 的 情况 时 有 发 生 ， 这 时 调用 malloc(68) 也 是 合理 的 ， 因 此 后 
者 的 动作 也 是 必要 的 。 基 于 这 种 思路 ， 如 果 malloc(8) 返 回 NULL， 
那 就 意味 着 发 生 了 内 存 不 足 或 其 他 错误 。 


换个 角度 来 想 ， 也 可 以 把 对 malloc(6) 的 调用 看 作 调 用 方 的 
Bug， 并 返回 NULL。 也 就 是 说 ， 像 这 种 数据 个 数 碰 巧 为 0 的 情况 ， 就 
让 调用 方 去 区 分 吧 。 基 于 这 种 思路 ， 就 会 采用 前 者 ， 即 “返回 空 指 
针 ” 这 个 动作 。 


在 设计 ANS1 Cc 标准时， 关于 应 当 采 用 这 两 个 动作 中 的 哪 一 个 ， 人 
们 似乎 进行 了 一 番 激 烈 的 争论 ， 最 终 采 取 了 “由 运行 环境 定义 ”这 一 
妥协 方案 。 由 运行 环境 定义 就 意味 着 ， 想 要 与 出 可 移植 性 高 的 程序 ， 
由 因此 最 终 的 决定 对 争论 双方 来 说 都 是 个 不 幸 的 
结局 。 


另外 ， 向 realloc() 的 第 2 个 参数 size 传 递 96， 则 第 1 个 参数 ptr 
指向 的 内 存 空间 会 被 释放 《与 free() 相 同 的 动作 ) 一 一 这 是 ANSI C 
中 明确 记载 的 。 但 在 C99 和 C011 中 ， 这 段 表 述 被 删除 了 。 然 而 ，C99 的 
Rat ionale 中 却 还 是 写 有 “1If the first argument is not null, 
and the second argument is 0, then the call frees the memory 
pointed to by the first _ argument” (如 果 第 1 个 参数 为 非 nul 1， 
第 2 个 参数 为 0， 那 么 第 1 个 参数 指向 的 内 存 空间 会 被 释放 ) ， 真 是 让 
人 摸 不 着 头脑 。 





总 之 ， 如 果 使 用 099 以 后 的 C 语 言 标准 ， 那 么 最 好 不 要 指 
望 realloc(ptr，6) 能 够 实现 和 free(ptr) 一 样 的 动作 。 


补充 malloc() 的 返回 值 检 查 
当 内 存 分 配 失败 时 ，malloc( ) 会 返回 NULL。 


因此 ， 大 多 数 的 C 语 言 书 会 略 显 歇斯底里 地 强调 “如 果 调 用 了 
malloc()， 就 一 定 要 检查 返回 值 ! ”但 本 书 就 偏 要 唱 唱 反 调 。 因 为 
这 种 做 法 太 麻烦 了 ! 


如 果 想 要 很 好 地 应 对 内 存 不 足 的 情况 ， 那 束 不 是 机 械 地 重复 编写 
如 下 代码 就 能 简单 完事 儿 的 了 。 


p = malloc(size); 
if (p == NULL) { 

return OUT_ OF MEMORY_ ERROR; 
} 


在 构造 某 种 数据 结构 的 过 程 中 ， 需 要 时 刻 注意 数据 结构 本 身 是 否 
会 产生 矛盾 ， 同 时 还 要 确保 函数 最 后 能 够 返回 。 而 且 ， 测 试 也 不 是 简 
简单 单 就 能 完成 的 。 


假设 上 面 这 些 已 经 完美 地 搞定 了 ， 结 果 却 在 分 配 几 字 节 的 内 存 时 
失败 了 ， 在 这 种 情况 下 ， 我 们 到 底 还 能 做 些 什么 呢 ? 


。 弹出 对 话 框 通知 用 户 “ 内 存 不 足 ” 不 过 在 这 种 情况 下 还 能 弹 
得 出 对 话 框 吗 ? 

姑且 打开 一 个 文件 用 来 保存 与 到 一 半 的 文档 内 容 …… 能 做 到 吗 ? 
为 了 保存 数据 ， 递 归 地 遍历 层次 很 深 的 树 形 数据 结构 …… 可 是 ， 
此 时 能 够 分 配 栈 空间 吗 ? 

不 管 怎样 ， 要 想 办 法 把 数据 保存 到 硬盘 上 …… 在 Windows 这 种 
在 普通 文件 系统 中 放置 交换 文件 《页 面 文件 ) 的 系统 中 ， 如 果 此 
时 只 有 一 个 分 区 ， 硬 盘 会 怎样 呢 ? 


其 实 ， 内 存 不 足 并 不 仅仅 发 生 在 显 式 调用 malloc() 的 地 方 ， 





进行 深度 递归 调用 也 会 造成 栈 空 间 不 足 ， 并 且 在 调用 fopen() 时 内 
部 也 会 使 用 malloc() 来 分 配 缓冲 区 内 存 空 间 ， 从 而 导致 内 存 不 
足 。 另 外 ， 根 据 操作 系统 的 不 同 ， 对 物理 内 存 的 分 配 也 有 可 能 不 在 调 
用 malloc() 时 进行 ， 而 在 对 该 内 存 空 间 写 入 时 才 进 行 〈Linux 默 
认 采 用 这 种 方式 ) 。 在 这 种 情况 下 ， 调 用 malloc() 时 可 能 无 法 检 
测 到 内 存 不 足 。 


如 果 要 开发 的 是 具有 极 高 的 通用 性 的 库 ，“ 认 认真 真 地 检查 返回 
值 ”的 确 是 合理 的 ， 但 我 们 所 与 的 程序 并 不 全 都 是 这 样 ， 因 此 在 多 数 
时 候 ， 不 妨 采 取 这 种 做 法 : 给 malloc() 加 上 一 层 壳 ， 当 发 生 内 存 
不 足 时 当场 报 出 错误 消息 并 终止 程序 。 


只 要 调用 了 malloc()， 就 必须 检查 返回 值 ， 并 做 出 适当 的 处 
理 ， 


持 有 以 上 观点 的 人 总 会 让 人 产生 诸多 疑问 ， 例 如 : 在 使 用 Java 
时 ， 他 们 是 不 是 一 定 会 在 适当 的 层次 中 catch 异常 
OutofMemoryError 呢 ? 他 们 是 不 是 完全 不 使 用 Per| 之 类 的 
Shell 脚本 语言 呢 ? 


补充 “程序 结束 时 也 必须 调用 free() 吗 


在 很 久 以 前 ， 网 上 的 新 闻 组 fj. comp. lang. c 曾经 针对 以 下 论题 
展开 过 激烈 的 讨论 。 


在 程序 结束 前 ， 是 否 必须 释放 该 程序 中 通过 malloc() 分 配 
的 内 存 空间 呢 ? 





这 是 一 个 相当 难 的 问题 。 当 前 ， 若 是 计算 机 等 常用 的 操作 系统 ， 
在 进程 结束 时 ， 该 进程 占有 的 内 存 空间 一 定 会 释放 。 从 这 个 意义 上 来 
说 ， 在 程序 结束 之 前 ， 没 有 必要 特地 执行 free( )。 


但 是 ， 当 要 把 “ 扔 个 文件 进去 让 它 处 理 ， 得 到 结果 后 就 结束 ”这 
样 的 程序 拓展 为 能 够 连续 处 理 多 个 文件 的 程序 时 ， 如 果 原 来 的 程序 没 
有 老 老实 实地 调用 free()， 那 后 面 的 人 就 要 遭 下 了 。 


另外 ， 近 年 来 ,为 了 检 出 内 存 泄漏 (忘记 free()) ， 人 们 开始 
广泛 地 借助 工具 输出 在 程序 结束 时 未 free() 的 内 存 空间 的 列表 
(比如 前 面 提 到 的 Valgrind 等 ) 。 这 时 ， 一 旦 “故意 不 去 free() 
的 内 存 空间 ”和 “忘记 free() 的 内 存 空间 ”混在 一 起 出 现 ， 检 查 
起 来 就 会 困难 重重 。 对 于 这 种 不 能 使 用 这 些 工 具 的 环境 ， 也 可 以 通 
过 “给 malloc() 和 free() 加 一 层 壳 ， 分 别 对 它们 的 调用 次 数 计 
数 ， 然 后 在 程序 结束 时 确认 数字 是 否 一 致 ”轻松 地 进行 检查 ， 这 样 的 
检查 可 以 有 效 检 出 内 存 泄漏 。 


从 这 一 点 上 考虑 ， 我 认为 “对 于 通过 malloc() 分 配 的 内 存 空 
间 ， 必 须 在 程序 结束 之 前 调用 free() 释放 掉 ” 的 方针 是 合理 的 。 


那么 ， 我 通常 是 怎么 做 的 呢 ? 当然 是 具体 问题 具体 分 析 了 。 


不 过 ， 我 是 不 怎么 喜欢 “必须 free() 派 ” 的 主张 的 ， 因 为 
在 “必须 free()” 的 背后 ， 是 下 面 这 些 想 法 在 作 崇 。 


e malloc() 之 后 必定 写 上 相应 的 free() 是 一 种 谨慎 的 编 
旦 风格 。 

。 程序 员 就 应 该 小 心 辟 翼 地 将 malloc() 和 free() 对 应 起 来 。 

。 “因为 调用 了 exit()， 所 以 就 没 必要 free() 了 ”的 想法 是 不 
负责 任 的 偷工减料 行为 ， 是 不 良 的 编程 风格 。 


不 管 怎么 说 ， 程 序 员 也 是 人 ， 人 就 是 这 么 一 种 在 可 能 犯错 的 地 
方 必 定 会 犯错 的 生物 。 可 是 ，“ 必 须 free() 派 ” 却 偏 要 大 肆 宣 扬 
无 论 如 何 都 要 “谨慎 地 ”编码 ， 这 种 论调 其 实 是 于 事 无 补 的 。 


我 认为 ，“ 谨 慎 地 ”编码 并 没有 什么 了 不 起 的 ， 那 些 能 够 尽 可 能 
地 回避 “麻烦 事 ” 的 人 才 是 优秀 的 程序 员 。 在 我 心中 ， 理 想 的 程序 员 
是 下 面 这 样 的 : 在 能 够 安全 地 偷懒 的 地 方 尽 可 能 地 偷懒 ， 并 且 尽 可 能 


地 依靠 工具 而 不 是 肉眼 来 进行 检查 ， 但 在 无 论 如 何 都 需要 人 工 处 理 麻 
烦 的 事情 时 ， 会 在 心中 坚定 地 起 督 “总 有 一 天 要 将 它 自动 化 ”。 


2-7 ”对 齐 | 


下 面 我 们 换 一 个 话题 。 
假设 有 如 下 所 示 的 结构 体 。 





typedef struct { 
char char1; 
int int1; 
char char2; 
double doublel; 
char char3; 

} Hoge; 





例如 在 我 的 环境 中 ，sizeof(int) 是 4，sizeof(double) 是 
8， 而 sizeof(char) 依据 标准 必须 是 1， 那 么 此 时 该 结构 体 的 长 度 


是 多 少 呢 ? 


”例如 ， 即 便 是 在 char 占 9 位 的 环境 〈 假 如 真 的 存在 这 样 的 环境 ) 
中 ，sizeof(char) 也 是 1。 标 准 就 是 这 样 规定 的 。 





1+4+1+8+1=15， 所 以 长 度 应 该 是 15 字 节 一 一 在 大 多 数 情况 下 ， 这 
个 结果 是 错误 的 。 例 如 ， 在 我 的 环境 中 ， 答 案 是 32 字 贡 。 


我 们 尝试 一 下 代码 清单 2-11) 。 


代码 清单 2-11 alignment.c 





#include “stdio.hy> 


typedef struct { 
char char1; 
int int1; 
char char2; 
double doublel; 
char char3; 

} Hoge; 


int main(void) 
{ 
Hoge hoge; 


printf("hoge size..%d\n", (int)sizeof(Hoge)); 


printf("hoge ..%p\n", (void*)&hoge); 
printf("char1 ..%p\n", (void*)&hoge.char1); 
printf("int1 ..%p\n", (void*)&hoge.int1); 
printf("char2 ..%p\n", (void*)&hoge.char2); 
printf("double1..%p\n", (void*)&hoge.doublel); 
printf("char3 ..%p\n", (void*)&hoge.char3); 


return 0©; 





先 随便 声明 一 个 Hoge 类 型 的 变量 ， 然 后 输出 其 各 个 成 员 的 地 
址 < 


”如 果 需 要 知道 结构 体 成 员 距离 起 始 位 置 的 偏 移 量 ， 一 般 使 用 stddef. h 中 定义 的 宏 
offsetof() 获取 。 这 样 一 来 ， 不 特意 声明 哑 变 量 虚拟 变 量 ) 就 可 以 获取 偏 移 量 。 





在 我 的 环境 中 ， 运 行 结果 如 下 所 示 。 





hoge size..32 


hoge . .0x7fffac3dd2206 
Char1  ..0x7fffac3dd226 
int1 . .0x7fffac3dd224 


char2 ..6x7fffac3dd228 
double1. .6x7fffac3dd230 


char3  ..0x7fffac3dd238 





如 图 2-17 所 示 ， 在 char1 和 char2 的 后 方 ， 以 及 结构 体 的 末 
尾 都 存在 一 段 间隙 。 


Ox7fffac3dd220 
间 阶 


Ox7fffac3dd224 
pie 
Ox7fffac3dd228 
Ox7fffac3dd22c 间隙 
Ox7fffac3dd230 
Ox7fffac3dd234 ee 


Ox7fffac3dd238 


Ox7fffac3dd23c 间隙 





图 2-17 ”对齐 


这 是 因为 ， 根 据 硬件 〈CPU) 的 不 同 ， 对 不 同 的 数据 类 型 能 够 配置 
的 地 址 是 有 限制 的 。 就 算 能 够 配置 ， 某 些 CPU 的 效率 也 会 变 差 。 在 这 
种 情况 下 ， 编 译 器 会 进行 适当 的 边界 调整 对齐，alignment) ， 向 结 
构 体 插入 适当 的 填充 (padding) 。 


从 本 实验 来 看 ， 在 我 的 环境 中 ，int 是 配置 在 4 的 倍数 的 地 址 上 
的 ， 而 double 是 配置 在 8 的 倍数 的 地 址 上 的 。 


正如 图 2-17 所 示 ， 填 充 有 时 会 被 放 到 结构 体 的 末尾 。 因 为 在 创建 
结构 体 数 组 时 ， 填 充 是 必要 的 。 在 将 sizeof 运算 符 应 用 到 这 样 的 结 


构 体 上 时 ， 返 回 的 是 包含 未 尾 填充 部 分 大 小 的 长 度 。 将 结果 和 元 素 个 数 
相 乘 ， 束 可 以 获取 数组 整体 的 长 度 。 


另外 ，malloc() 会 配合 那些 对 齐 最 为 严格 的 类 型 返回 经 过 适当 调 
整 的 地 址 。 局 部 变量 等 也 会 被 配置 到 经 过 适当 调整 的 内 存 空 间 中 。 


对 齐 是 根据 CPU 的 情况 进行 的 操作 。 因 此 ，CPU 不 同 ， 填 充 的 方 
式 也 就 不 同 。 在 我 的 环境 中 ， 碰 巧 只 能 将 double 配置 在 8 的 倍数 的 
地 址 上 ， 而 有 些 CPU 可 以 将 它 配置 到 4 的 倍数 的 地 址 上 。 


”在 本 书 第 1 版 中 ，double 就 是 配置 在 4 的 倍数 的 地 址 上 的 。 





偶尔 也 会 有 人 不 喜欢 对 齐 万 式 依赖 于 硬件 ， 于 是 “为 了 提高 程序 的 
可 移植 性 ”〈? ) 试图 手工 进行 边 珊 调整， 如 下 所 示 。 


typedef struct { 
char char1l; 
char pad1[3]; “-- 手工 进行 填充 
int int1; 
char char2; 























char pad2[7]; <-- 这 里 也 是 

double doublel; 

char char3; 

char pad3[7]; <-- 这 里 也 是 
} Hoge; 











然而 ， 这 到 底 有 什么 用 呢 ? 


即便 不 这 么 做 ， 编 译 器 也 一 定 会 根据 CPU 帮 有 我 们 对 边 丙 做 出 适当 
的 调整 。 只 要 是 通过 成 员 名 称 进 行 引 用 的 ， 融 根本 没有 必要 知道 到 底 进 
行 了 什么 样 的 对 齐 。 


如 果 需 要 将 该 结构 体 原封 不 动 地 (通过 fwrite() 等 ) 写 入 文 
件 ， 然 后 在 CPU 不 同 的 其 他 机 器 上 读 取 并 使 用 ， 那 么 对 齐 方式 的 不 同 
可 能 会 引发 问题 。 而 如 果 手 工 进行 边界 调整 ， 说 不 定 可 以 在 其 他 机 器 上 
读 出 本 机 输出 的 数据 一 一 然而 ， 这 说 到 底 只 是 碰巧 了 。 


在 上 面 的 例子 中 ，pad1 的 长 度 是 3，pad2 和 pad3 的 长 度 是 
7。 那 么 ， 这 些 数字 到 底 是 来 自 哪里 昵 ? 标准 并 不 保证 sizeof(int) 
就 是 4，sizeof(double) 就 是 8。 把 这 样 的 数字 写 到 源 代码 中 根本 就 
谈 不 上 什么 “提高 可 移植 性 ”。 

也 就 是 说 ， 即 便 手工 填充 的 方式 实现 了 特定 机 器 之 间 的 数据 交换 ， 
那 也 只 不 过 是 敷衍 逃避 的 手段 而 已 。 如 果 是 像 原型 开发 那样 求 快 不 求 质 
的 开发 场景 ， 或 许 会 考虑 使 用 这 种 手法 ， 但 如 果真 的 要 考虑 数据 的 兼容 
总 那么 将 结构 体 原封 不 动 地 转 储 到 文件 中 这 一 想法 本 身 就 是 不 对 


不 仅 如 此 ， 就 算是 sizeof(int) 为 4 的 运行 环境 ， 其 内 部 表现 
也 不 一 定 相 同 。 关 于 这 一 点 ， 我 们 会 在 下 一 节 进 行 说 明 。 


要 点 
即使 手工 填 入 填充 数据 ， 也 不 能 提高 可 移植 性 。 


补充 “结构 体 的 成 员 名 称 在 运行 时 也 是 缺失 的 


对 结构 体 成 员 的 引用 是 通过 距离 结构 体 起 始 地 址 的 偏 移 量 〈 字 节 
单位 的 距离 》 实 现 的 。 例 如 ， 在 访问 代码 清单 2-11 中 的 结构 体 Hoge 
的 double1 时 ， 就 需要 引用 距离 结构 体 起 始 地 址 16 字 节 的 地 
方 。“16” 这 个 值 写 在 了 编译 后 的 机 嚣 码 中 。 


这 里 并 不 是 通过 double1 这 个 名 称 引 用 结构 体 成 员 的 。 因 此 ， 如 
et 让 了 改变 ， 就 必须 将 使 用 这 个 结构 体 的 源 文件 全 部 
重新 编译 一 遍 。 





2-8 字 节 序 | 


我 的 环境 是 在 普通 的 计算 机 (Let's Note*) 的 Windows 10 上 通 
过 Virtual Box 运行 Ubuntu Linux，sizeof(int) 是 4。 那 么 ， 在 
这 4 个 字 节 中 ， 整 数 具 体 是 以 什么 样 的 形式 存放 的 呢 ? 


”日 本 松下 公司 发 布 的 笔记 本 电脑 。 一 一 译 者 注 





我 们 再 写 一 个 测试 程序 来 验证 一 下 代码 清单 2-12) 。 


代码 清单 2-12 byteorder.c 


#include <stdio.h> 


int main(void) 
{ 
int hoge = 6x12345678 ; 
unsigned char *hoge _p = (unsigned char*)&hoge; 


printf("%x\n", hoge _p[98]); 
printf("%x\n", hoge _p[1]); 
printf("%x\n", hoge _p[2]); 
printf("%x\n", hoge_p[3]); 


return ©; 





将 int 类 型 变量 hoge 的 起 始 地 址 强行 赋 给 unsigned char * 
类 型 的 变量 hoge_p， 然 后 应 该 融 可 以 通过 引用 
hoge_p[6] hoge_p[3] 来 以 字 节 为 单位 引用 hoge 的 内 容 了 。 


在 我 的 环境 中 ， 运 行 结果 如 下 所 示 。 


78 
56 
34 
12 


遇 看 来 ， 在 我 的 环境 中 ，“0x12345678” 这 个 值 在 内 存 上 是 逆向 存放 


可 能 有 读者 会 感到 意外 ， 但 是 在 Intel 系列 的 CPU (当然 也 包括 
AMD 等 兼容 CPU) 上 ， 整 数 类 型 就 是 像 这 样 在 内 存 上 倒 过 来 存放 的 ， 这 
种 存储 方法 一 般 称 为 小 端 (little endian) 。 


虽然 近年 来 不 论 是 客户 端 计 算 机 还 是 服务 器 ， 用 的 都 是 Intel 系 
列 的 CPU， 但 过 去 的 工作 站 等 的 CPU 经 常 将 “0x12345678” 这 样 的 值 
以 “12、34、56、78” 的 形式 存储 ， 这 种 存储 方法 称 为 大 端 (big 
endian) 。 智 能 手机 等 常用 的 ARM 架构 使 用 的 是 可 以 在 大 端 和 小 端 之 
间 切 换 的 双 端 (bi-endian) 。 


而 小 端 和 大 端 这 样 的 字 布 排列 万 式 就 称 为 字 节 序 (byte order) 。 


小 端 与 大 端 到 底 哪 一 种 更 好 呢 ? 这 个 话题 经 常 引 起 人 们 的 争论 ， 此 
处 就 不 再 深入 讨论 了 。 它 们 各 有 各 的 优点 。 人 类 在 用 纸 和 笔 做 加 法 时 也 
会 从 低位 开始 相 加 ， 所 以 对 CPU 来 说 ， 或 许 采用 小 端的 方式 更 轻松 一 
些 ， 而 在 人 类 看 来 ， 大 端的 方式 或 许 更 容易 理解 。 


问题 是 ， 就 连 整数 类 型 的 数据 在 内 存 中 的 存储 方式 也 会 因 CPU 不 
同 而 不 同 。 


事实 上 ， 也 有 一 些 CPU 会 采用 更 加 风格 迎 异 的 字 节 序 ， 比 如 “以 
2 字 节 为 1 组 再 反 转 顺序 ”。 另 外 ， 关 于 浮 点 数 ， 虽 然 现今 的 许多 运 
行 环境 使 用 的 是 IEEE 754 规定 的 形式 ， 但 5 语言 标准 中 并 没有 规定 
这 一 点 *。 即 使 是 使 用 IEEE 754 的 运行 环境 ，lntel 系列 的 CPU 也 还 
是 逆向 排列 字 节 的 。 





也 就 是 说 ， 由 于 内 存 中 的 二 进 制 形式 会 因 环境 不 同 而 多 种 多 样 ， 所 
以 有 些 想 法 是 不 可 取 的 ， 例 如 试图 将 内 存 中 的 内 容 直接 与 到 硬盘 上 ， 
人 
的 。 


如 果 要 考虑 数据 兼容 性 ， 可 以 使 用 XML 或 JSON， 或 者 二 进 制 ， 总 
之 需要 确定 一 种 数据 格式 ， 然 后 遵循 该 格式 输出 数据 。 


数 还 是 浮 点 数 ， 在 内 存 上 的 表现 形式 都 随 环 境 不 同 而 





2-9 ”关于 语言 规范 和 实现 一 一 抱歉 ， 前 面 的 内 容 
都 是 骗 你 的 


直到 本 市 为 止 ， 我 们 都 是 通过 实际 运行 示例 程序 ， 并 基于 在 我 的 环 
境 中 输出 的 结果 进行 各 种 说 明 的 。 


然而 ，C 语言 标准 规定 的 是 语言 规范 ， 而 不 是 实现 方法 。 


例如 ， 如 今 的 计算 机 操作 系统 会 帮 有 我 们 实现 虚拟 地 址 的 功能 ， 但 即 
人 
H。 


另外 ， 前 面 提 到 “在 C 语言 中 ， 上 自动 变量 通常 被 分 配 到 栈 中 ”， 
但 标准 并 没有 这 么 规定 。 因 此 ， 比 如 某 个 运行 环境 在 每 次 进入 函数 时 都 
将 自动 变量 的 内 存 空间 分 配 到 堆 中 ， 那 也 是 出 色 地 与 标准 保持 一 致 的 。 
只 不 过 ， 这 种 实现 的 运行 速度 会 很 慢 ， 所 以 没 人 会 去 做 这 种 傻 事 。 


至 于 malloc() 的 实现 ， 其 在 不 同 的 运行 环境 中 会 出 现 很 大 的 差 
异 。brk() 则 是 UNIX 中 特有 的 系统 调用 ， 而 且 近 年 来 UNIX 中 也 出 
现 了 下 面 这 种 分 配方 式 : 在 分 配 较 大 的 内 存 空 间 时 ， 使 用 系统 调用 


mmap()， 然 后 通过 free() 释放 内 存 空间 ， 并 将 内 存 空间 返还 给 操作 


更 进一步 来 说 ， 从 第 1 章 开始 我 们 就 是 以 “指针 就 是 地 址 ”为 前 
提 进 行 说 明 的 ， 但 标准 中 只 是 说 “指针 类 型 描述 一 个 对 象 ， 该 类 对 象 的 
值 提供 对 该 引用 类 型 的 实体 的 引用 ”。 总 而 言 之 ， 只 要 能 够 引用 实体 ， 
就 算 没 有 有 效 地 使 用 虚拟) 地址， 也 不 算 违反 标准 。 


由 于 在 5 语言 中 ， 地 址 经 常 以 指针 的 形式 直接 可 见 ， 所 以 人 们 对 
0 语言 常常 持 有 以 下 看 法 。 


。 如果 没有 时 刻 关 注 内 存 的 意识 ， 就 不 能 进行 C 语言 编程 。 
。 (5 语言 不 就 是 结构 化 的 汇编 器 吗 ? 
。0C 语言 不 就 是 低级 语言 吗 ? 


但 是 ， 一 般 的 应 用 程序 程序 员 在 开发 程序 时 ， 完 全 没有 必要 在 意 指 
针 就 是 地 址 这 件 事 。 


C 语言 可 能 的 确 是 低级 语言 ， 但 假如 你 明明 想 要 使 用 高 级 语言 却 不 
得 已 只 能 使 用 5 语言 ， 那 就 别 故 作 姿 态 地 嘲讽 5 语言 是 低级 语言 了 ， 
又 得 不 到 什么 好 处 。 而 且 即 使 在 某 个 运行 环境 中 地 址 就 是 指针 ， 也 别 纠 
结 ， 忘 掉 这 一 点 才 是 最 聪明 的 做 法 。C 就 是 那 种 只 要 你 想 ， 那 你 就 可 
以 把 它 当 作 高 级 语言 使 用 的 语言 一 一 如 果 你 真 的 这 么 认为 ， 那 就 静 静 地 
等 待 Bug 的 到 来 吧 。 


话 虽 如 此 ， 本 章 在 对 各 部 分 进行 说 明 时 ， 还 是 强调 了 “指针 就 是 地 
址 ” 





与 其 反复 地 抽象 说 明 ， 还 不 如 具体 地 把 地 址 输出 出 来 更 简单 易 懂 
这 就 是 我 这 样 做 的 初衷 。 将 自动 变量 的 地 址 输出 出 来 ，“ 栈 会 随 着 
郧 数 调用 不 断 延 伸 ” 的 知识 点 就 会 一 目 了 然 。 要 是 理解 不 了 这 个 知识 
点 ， 那 就 无 法 弄 明 白 递 归 调 用 的 原理 。 

另外 ， 现 实 是 ， 在 大 多 数 环境 中 5 语言 几乎 不 进行 运行 时 检查 ， 
A 0 语言 的 内 存 使 用 方法 ， 调 试 工作 也 
公 委 一 定 影响 。 


另外 ， 遇 到 不 明白 的 地 方 ， 要 通过 实验 确认 ， 这 也 是 科学 研究 的 惯 





用 手法 。 
对 于 本 章 的 示例 程序 ， 请 务必 在 自己 的 环境 中 尝试 实际 运行 一 下 。 


不 过 ， 一 旦 通过 实验 接受 了 这 个 知识 点 ， 就 要 注意 别 过 分 在 意 “ 指 
针 就 是 地 址 ”， 否 则 你 很 可 能 写 出 一 些 抽象 度 低 且 可 移植 性 差 的 代码 。 


此 外 ， 万 一 出 现 了 Bug， 请 回想 一 下 “指针 就 是 地 址 ”的 观点 ， 然 
后 努力 调试 一 一 这 种 姿态 在 解决 Bug 上 是 恰到好处 的 。 


第 3 章 


语法 揭秘 一 一 它 到 底 是 怎么 回 事 


CD 
人 
下 
各 
让 
nH 
了 中 
珊 
于 


3-1-1 用 英语 阅读 
1-3-3 节 的 补充 内 容 中 提 到 ，0C 语言 的 如 下 声明 语法 非常 奇怪 。 


int hoge[108]; 


对 于 上 面 这 种 程度 的 声明 ， 可 能 许多 人 并 不 觉得 有 什么 异样 ， 那 么 
下 面 这 种 “还 挺 常用 的 ) 声明 呢 ? 
char *color name[] = { 


"red", 
"green", 


"blue", 


}; 





这 表示 的 是 “指向 char 的 指针 的 数组 ”。 


我 们 在 2-3-2 市 中 像 下 面 这 样 声 明了 一 个 “指向 以 double 为 参 
数 且 无 返回 值 的 级 数 的 指针 。 


void (*func_p)(double); 


关于 这 种 声明 ，K&R 中 是 这 么 说 明 的 《〈“ 见 该 书 5. 12 节 ) : 


int *f(); /* f: function returning pointer to int */ 
以 及 


int (*pf)(); /* pf: pointer to function returning int */ 


这 里 ，* 是 一 个 前 缀 运算 符 ， 其 优先 级 低 于 ()， 所 以 声明 中 必 
须 使 用 圆 括 号 以 确保 正确 的 结合 顺序 。 





首先 ， 这 段 文字 里 有 不 恰当 的 地 方 。 

正如 1-3-3 节 所 说 ， 声 明 中 的 *、()、[] 并 不 是 运算 符 ， 在 语 
法 规则 中 ， 它 们 的 优先 级 也 不 是 在 定义 运算 符 优先 级 的 地 方 定义 的 ， 而 
是 在 其 他 地 方 定义 的 。 


而 且 ， 就 算 不 管 这 一 点 ， 只 单纯 地 阅读 这 段 文 字 ， 一 般 人 也 会 默默 
怀疑 “是 不 是 说 反 了 ”。 


如 果 说 下 面 的 声明 表示 的 是 “指向 函数 的 指针 ”， 那 么 先 将 星 号 
(指针 〉 的 部 分 括 起 来 不 是 很 奇怪 吗 ? 


int (*pf)(); 


这 个 问题 的 答案 说 穿 了 其 实 很 简单 : 5 语言 原本 是 在 美国 诞生 的 语 
言 ， 所 以 我 们 应 该 用 英语 来 读 上 面 的 声明 。 


”K&R 中 写 有 用 于 解析 5 语言 声明 的 程序 dcl 以 及 相应 的 输出 结果 ， 但 中 文 版 中 并 


没有 翻译 出 来 ， 而 是 直接 保留 了 英语 原文 。 





如 果 从 pf 开始 按 美语 的 语序 来 阅读 上 面 的 声明 ， 则 应 该 是 下 面 这 
样 ”。 


* 我 觉得 应 该 在 下 面 这 人 句 话 中 加 上 冠 词 a， 写 成 “pf is a pointer”， 不 过 鉴于 K&R 


的 dcl 中 也 没有 加 冠 词 a， 而 且 加 上 会 使 句子 太 过 元 长 ， 所 以 本 书 中 就 不 加 了 。 





pf is pointer to function returning int 


中 文章 思 如 下 所 示 O 





pf 是 指向 返回 int 的 函数 的 指针 。 


要 点 


0 语言 的 声明 要 用 英语 阅读 。 





3-1-2 解读 C6 语言 声明 
这 里 给 大 家 介绍 一 下 C6 语言 声明 的 “机 械 解 读 法 ”。 


首先 ， 为 了 使 问题 简单 化 ， 我 们 先 不 考虑 const 和 
volatile (3-4 节 将 给 出 考虑 const 的 版 本 ) 。 


我 们 可 以 遵循 以 下 步 又 解释 C 语言 声明 。 
)1. 先 看 标识 符 变量 名 或 函数 名 ) 。 


)2. 从 贴近 标识 符 的 地 方 开始 ， 按 照 如 下 优先 级 解释 派生 类 型 〈“ 指 
针 、 数 组 、 函 数 ): 


WD 用 于 整合 声明 的 括号 ; 
表示 数组 的 [] 、 表 示 阻 数 的 (); 
(3 表示 指针 的 *。 


)3. 完成 对 派生 类 型 的 解释 之 后 ， 通 过 of 、to 或 returning 连 
接 句 子 。 


)4. 添加 类 型 修饰 符 〈 位 于 左 侧 ， 比 如 int、double) 。 
)5. 如 果 不 擅长 英语 ， 可 以 用 中 文 解 释 。 


数组 的 元 素 个 数 和 函数 的 参数 都 属于 类 型 的 一 部 分 。 请 将 它们 当 作 
附属 于 各 自 类 型 的 属性 。 


比如 下 面 这 行 代码 。 
让 先 看 标识 符 。 
英语 表达 : 
)2. 因为 代码 中 有 括号 ， 所 以 接 下 来 看 一 下 *。 


英语 表达 : 
)3. 然后 是 表示 子 数 的 ()， 参 数 是 double。 


int (*func _p)(double); 


英语 表达 : 


func_p is pointer to function(double) returning 


)4. 最 后 是 类 型 修饰 符 int。 


int (*func p)(double); 


英语 表达 : 


func_p is pointer to function(double) returning int 


)5. 翻译 成 中 文 。 
func_p 是 指向 返回 int 的 函数 (参数 是 double) 的 指针 。 


以 同样 的 方式 对 各 种 C 语言 声明 进行 解读 的 结果 如 表 3-1 所 
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0 语言 
int hoge; 


int 
hoge[16] ; 


Int 
hoge[16] 
[3] 


Int 
*hoge[106]; 


double 
(*hoge) 
[3]; 

int 
func(int 
a); 

ai 
(UTCEED) 
(ine al 





解读 各 种 C 语言 声明 


英语 表达 中 文 表达 
i 元 素 1 


hoge is array 〈 元 素 个 数 为 10) of | hoge 是 int 的 数组 〈 元 素 个 数 为 
int 10) 
为 


hoge is array 〈 元 素 个 数 为 10) of |hoge 是 int 的 数组 (元 素 个 数 大 
array 《元 素 个 数 为 3) of int 3) 的 数组 (元 素 个 数 为 10) 


hoge is array 〈 元 素 个 数 为 10) of |hoge 是 指向 int 的 指针 的 数组 
pointer to int (元 素 个 数 为 10) 


hoge is pointer to array (元 未 个 hoge 是 指向 double 数 组 (FE 个 
数 为 3) of double 数 为 3) 的 指针 


func is function 《参数 为 int func 是 返回 int 的 函数 〈 人 参数 
a returning int 为 int a) 
func_p is pointer to 


mr ee func_p 是 指向 返回 int 的 函数 
function (参数 为 int (参数 为 int a 的 指针 


3 returning int 


如 上 所 示 ，C 语言 的 声明 (无论 中 文 还 是 英文 ) 不 能 从 左 往 右 
解读 ， 必 须 左右 来 回 地 解读 。 


关于 5 语言 的 声明 ，K&R 中 与 道 : “这 种 声明 变量 的 语法 与 


声明 该 变量 所 在 表达 却 的 语法 类 似 。 ”《〈 见 该 书 5.1 节 ) 但 勉强 
地 去 仿效 本 质 上 完全 不 同 的 东西 ， 结 果 只 能 导致 语法 莫名 其 妙 。 


“使 声明 的 形式 与 使 用 时 的 形式 相似 ”是 C 语言 (以 及 从 6 
语言 派生 的 C++ 等 语言 ) 特有 的 奇怪 语法 。 


K&R 中 同时 提 到 〈 见 该 书 5. 12 市 ) : 


0 语言 常常 因为 声明 的 语法 问题 而 受到 人 们 的 批评 ， 特 别 是 


涉及 函数 指针 的 语法 。 





比如 在 Pascal 中 ,，C 语言 中 的 “int hoge[16];” 是 像 下 面 
这 样 声 明 的 。 


var 
hoge : array[6..9] of integer; 


对 于 这 种 语法 ， 我 们 完全 可 以 从 左 往 右 按 英语 语序 解读 。 
C 语言 的 设计 者 丹尼斯 。 里 奇 后 来 又 开发 了 一 种 叫 Limbo 的 
语言 。Limbo 语言 中 的 符号 用 法 等 乍 一 看 与 6 语言 非常 相似 *， 但 


声明 的 语法 却 很 好 地 改 成 了 Pascal 的 风格 。 这 说 明 设 计 者 自身 也 
在 反省 C 语言 的 声明 语法 。 


”例如 ， 不 用 begin“end 或 者 if*endif， 而 使 用 花 括号 。 


补充 近来 的 语言 多 数 是 将 类 型 后 置 的 


如 今 已 经 没什么 人 使 用 Pascal 了 ， 而 Limbo 这 种 语言 估计 大 
多 数 人 连 名 字 都 没 听 说 过 ， 不 过 即便 是 那些 最 近 几 年 开发 出 来 并 拥有 





一 定 用 户 的 语言 ， 也 有 相当 一 部 分 在 声明 变量 时 把 类 型 写 在 后 面 。 而 
这 几 年 的 语言 则 大 都 是 这 样 的 。 


例如 Google 开发 的 Go 语言 是 通过 以 下 方式 声明 int 类 型 变 


量 的 。 


数组 的 声明 是 下 面 这 样 的 。 


var hoge [J]int 


Apple 为 i0S 应 用 开发 而 制作 的 Swift 语言 是 像 下 面 这 样 声 明 
int 类 型 变量 的 。 


var hoge : Int 
数组 的 声明 是 下 面 这 样 的 。 


在 JVM 上 运行 的 语言 Scala 则 是 像 下 面 这 样 声 明 int 类 型 变 


量 的。 在 Scala 中 ， 在 声明 变量 时 必须 进行 初始 化 。 另 外 ， 在 实际 
情况 中 ， 人 们 使 用 更 多 的 不 是 var， 而 是 不 能 再 被 赋值 的 val。 


数组 的 声明 是 下 面 这 样 的 。 


var hoge: Array[int] = null; 


用 于 开发 Adobe Flash 的 ActionScript 是 像 下 面 这 样 声 明 
int 类 型 变量 的 。 


var hoge : int; 


数组 的 声明 是 下 面 这 样 的 。 


var hoge : Array 


这 类 例子 数不胜数 ， 我 们 就 先 瑟 到 这 里 。C、Java 和 0C# 这 些 语 
的 声明 中 先 写 类 型 的 做 法 并 不 是 “ 理 所 应 当 ” 的 一 一 对 此 ， 这 一 
必 大 家 都 明日 了 。 


点 想 
i 





3-1-3 ”类 型 名 


在 C6 语言 中 ， 除 了 声明 标识 符 以 外 ， 有 了 时候 还 必须 标记 “类 
型 ”， 具 体 情况 如 下 所 示 。 


。 在 类 型 转换 运算 符 中 
。 在 将 类 型 当 作 操 作 数 时 的 sizeof 运算 符 的 操作 数 


例如 ， 类 型 转换 运算 符 的 写法 如 下 所 示 。 


(int*) 





这 里 指定 的 int* 就 称 为 类 型 名 (type name) 。 
从 标识 符 的 声明 中 去 除 标识 符 ， 就 可 以 机 械 地 生成 类 型 名 〈 表 3- 


2 
类 型 名 类 型 名 的 含义 
加 


表 3-2 类 型 名 的 写法 





PO hoge 是 指向 int 的 指针 指向 int 的 指针 类 型 


double p 是 指向 double 数 组 (元 double 指向 double3 (元 素 个 
(*p) [3]; 素 个 数 为 3) 的 指针 (*)[3] 数 为 3) 的 指针 类 





void func 是 指向 返回 void 的 指向 返回 void 的 函数 的 
(*func)(); | 函数 的 指针 指针 类 型 


在 表 3-2 中 ， 最 后 两 个 例子 中 的 星 号 都 在 括号 内 ， 这 种 写法 看 似 
多 余 ， 但 如 果 去 掉 插 号， 声明 的 合 义 就 不 一 样 了 。 


例如 ，double *hoge[3] 去 掉 标 识 符 名 称 会 得 到 double * 


[3]， 所 以 这 个 类 型 名 的 含义 就 会 变 成 “指向 double 的 指针 的 数 
组 ” 。 


补充 “如 果 把 间接 运算 符 * 后 置 
在 5 语言 中 ， 通 过 指针 取 值 的 运算 符 * 需要 像 *p 这 样 前 置 
使 用 。 


而 在 Pascal 中 ， 相 当 于 5 语言 的 * 运算 符 的 ^ 是 后 置 使 用 
的 。 

如 果 在 5 语言 中 也 像 这 样 将 引用 指针 的 运算 符 后 置 ， 那 么 即便 
是 兼顾 “声明 变量 的 语法 与 声明 该 变量 所 在 表达 陈 的 语法 类 似 ”， 声 
明 也 会 变 成 下 面 这 样 。 


int func p^(double); 


如 果 这 样 写 是 表示 “指向 返回 int 的 函数 (参数 为 double) 
的 指针 ”， 那 么 基本 上 可 以 以 英语 语序 阅读 。 不 过 int 放 在 前 面 终 
究 还 是 个 问题 。 


如 果 把 运算 符 也 顺便 换 成 后 置 的 ^， 通 过 指针 引用 结构 体 成 员 
的 运算 符 -> 就 可 以 不 要 了 。 


”在 5 语言 中 ，^ 是 作为 异 或 运算 符 使 用 的 ， 这 里 先 不 管 这 一 点 。 





hoge->piyo 
原本 就 只 是 
(*hoge) .piyo 


的 语法 糖 而 已 ， 所 以 如 果 可 以 写成 下 面 这 样 ， 那 么 不 要 -> 也 完 
全 可 以 。 


hoge^ .piyo 


进一步 说 ， 将 间接 运算 符 后 置 能 够 使 包含 结构 体 成 员 或 数组 引用 
的 复杂 表达 式 的 写法 更 加 简洁 。 


”我 还 觉得 顺便 把 指针 的 类 型 转换 也 进行 后 置 的 做 法 更 好 。 
语言 中 也 不 是 没有 后 置 的 间接 运算 符 ，[8] 就 是 后 置 的 间接 运算 符 。 


实际 上 ,C6 





关于 这 一 点 ，The Development of the C Language 中 有 如 下 内 


Sethi [ Sethi 81] observed that many of the nested 
declarations and expressions would become simpler If the 
Indirection operator had been taken as a postfix operator 
Instead of prefix, but by then it was too late to change. 





以 我 可 怜 的 英语 能 力 将 其 翻译 成 中 文 ， 大 意 如 下 。 


Sethi [Sethi 81] 注意 到 ， 如 果 间 接 运 算 符 采用 后 置 而 不 是 前 
本 
晚 。 





前 面 我 们 对 5 语言 声明 的 解读 方法 进行 了 说 明 。 


人 通过 解读 声明 ， 我 们 了 解 了 变量 和 函数 的 “类 型 ”。 本 节 将 介绍 C 
语言 是 如 何 处 理 类 型 的 。 


3-2-1 基本 类 型 和 派生 类 型 
假设 有 如 下 声明 。 





int (*func table[16])(int a); 





根据 上 一 市 的 说 明 ， 我 们 可 以 将 它 解 读 为 : 


指向 返回 int 的 函数 〈 人 参数 为 int a) 的 指针 的 数组 (元 素 个 
数 为 10) 





上 面 的 表述 可 以 表示 为 如 图 3-1 所 示 的 链 结构 。 





指向 返回 的 的 的 . 
> | nt 指针 数组 





元 素 个 数 为 10 


图 3-1 用 图 形 表示 “类型 
在 本 书 中 ， 我 们 称 这 种 表示 形式 为 “类 型 的 链 式 表 示 ”。 


这 里 暂且 无 视 结构 体 、 联 合体 、typedef 等 ， 粗 略 地 进行 说 明 。 
链 的 初始 元 素 是 * 基 本 类 型 (basic type) ， 这 里 可 以 放 上 int 或 者 
double 等 类 型 。 


”如 果 是 英语 语序 ， 这 里 应 该 是 末尾 元 素 。 





然后 ， 从 第 2 个 元 素 开 始 的 元 素 都 是 派生 类 型 (derived 
type) 。 所 谓 派 生 类 型 ， 就 是 从 菏 些 类 型 派生 出 来 的 类 型 。 


除了 结构 体 和 联合 体 之 外 ， 派 生 类 型 还 有 以 下 3 种 。 
。 指 针 


。 数组 (以 元 素 个 数 为 属性 ) 
。 也 数 以 参数 信息 为 属性 ) 


关于 派生 类 型 ，K&R 中 有 如 下 描述 〈 见 该 书 A. 4.3 节 ) 。 


除 基本 类 型 外 ， 我 们 还 可 以 通过 以 下 几 种 方法 构造 派生 类 型 ， 从 
概念 来 讲 ， 这 些 派生 类 型 可 以 有 无 限 多 个 。 


给 定 类 型 对 象 的 数组 

返回 给 定 类 型 对 象 的 函数 

指向 给 定 类 型 对 象 的 指针 

包含 一 系列 不 同类 型 对 象 的 结构 

可 以 包含 多 个 不 同类 型 对 象 中 任意 一 个 对 象 的 联合 


一 般 情 况 下 ， 这 些 构造 对 象 的 方法 可 以 递归 使 用 。 





上 面 这 段 描述 可 能 让 你 摸 不 着 头脑 ， 这 里 要 表达 的 其 实 是 下 面 这 个 


”实际 上 ， 派 生 是 有 几 点 限制 的 。 关 于 这 些 ， 我 们 后 面 再 进行 说 明 。 


以 基本 类 型 开头 ， 通 过 递归 地 (重复 地 ) 增加 派生 类 型 ， 可 以 创 
造 出 无 限 多 个 类 型 。 





也 就 是 说 ， 不 断 延 长 图 3-1 的 链 结 构 ， 就 可 以 创造 出 新 的 类 型 。 


另外 ， 在 图 3-1 的 链 结 构 中 ， 最 后 的 那个 类 型 对 整个 类 型 的 含义 
具有 重要 意义 ， 因 此 这 里 特别 地 将 它 称 为 类 型 分 类 (type 
category) 。 


比如 ， 不 论 是 指向 int 的 指针 ， 还 是 指向 double 的 指针 ， 归 根 


结 底 都 是 指针 ; 不 论 是 int 的 数组 ， 还 是 指向 char 的 指针 的 数组 ， 
总 而 言 之 也 都 是 数组 。 


3-2-2 ”指针 类 型 的 派生 


在 1-3-1 市 中 ,我 们 引用 了 5 语言 标准 中 的 内 容 ， 这 里 再 次 引用 
一 个 。 


指针 类 型 (pointer type) 可 以 由 函数 类 型 、 对 象 类 型 或 不 完全 
类 型 派生 ， 派 生 指针 类 型 的 类 型 称 为 被 引用 类 型 (referenced 
type) 。 指 针 类 型 描述 了 一 种 对 象 ， 其 值 用 于 引用 被 引用 类 型 的 实 


体 。 由 被 引用 类 型 T 派生 的 指针 类 型 称 为 “指向 T 的 指针 ”。 由 被 
引用 类 型 构造 指针 类 型 的 过 程 称 为 “指针 类 型 的 派生 ”。 这 些 构 造 派 
生 类 型 的 万 法 可 以 递归 地 应 用 。 





上 面 的 “从 被 引用 类 型 T 派生 的 指针 类 型 称 为 “指向 T 的 指 
针 ”” 可 以 用 链 结构 表示 (图 3-2) 。 


这 里 整个 表示 被 引用 类 型 T 指向 
大 3 
类 型 


图 3-2 ”指针 类 型 派生 


对 于 指针 类 型 来 说 ， 如 果 指 针 指向 的 类 型 不 同 ， 派 生出 来 的 类 型 惑 
会 个 同 ， 因此 从 已 有 类 型 T 派生 ， 就 可 以 创造 出 “指向 T 的 指针 ”类 
型 。 


由 于 在 大 多 数 运 行 环境 中 ， 指 针 从 实现 上 来 说 只 是 单纯 的 地 址 ， 所 
以 不 论 是 从 什么 样 的 类 型 派生 出 来 的 指针 ， 其 运行 时 的 状态 都 没有 多 大 
区 别 “， 不 过 在 加 上 * 运算 符 ， 通 过 指针 取 值 时 ， 以 及 对 指针 进行 加 法 
运算 时 ， 其 运行 时 的 状态 是 会 有 差别 的 。 


”前 面 也 提 到 了 这 一 点 ， 具 体 来 说 ， 就 是 偶尔 也 存在 这 样 的 运行 环境 : 指向 char 的 


引 针 与 指向 int 的 指针 的 位 数 不 同 。 





这 里 再 次 强调 一 下 : 对 指针 进行 加 法 运算 ， 则 指针 前 进 该 指针 所 指 
向 的 类 型 的 长 度 的 距离 。 这 对 我 们 之 后 的 说 明 具 有 非常 重要 的 意义 。 


如 果 用 图 说 明 指 针 类 型 ， 则 如 图 3-3 所 示 。 


指向 T 的 指针 





加 1 后 指向 这 里 一 一 





图 3-3 指针 类 型 的 图 解 
3-2-3 ”数组 类 型 的 派生 


和 指针 类 型 一 样 ， 数 组 类 型 也 是 从 已 有 类 型 元素 类 型 ) 派生 而 来 
的 。 元 素 个 数 作为 类 型 的 属性 信息 添加 在 类 型 后 面 (图 3-4) 。 


图 3-4 数组 类 型 派生 
数组 类 型 是 由 一 定 个 数 的 派生 源 的 类 型 排列 而 成 的 类 型 。 
数组 类 型 可 以 用 图 3-5 说 明 。 


派生 源 的 类 型 T 


T 的 数组 
( 元 素 个 数 为 5 ) 





图 3-5 数组 类 型 的 图 解 
3-2-4 ”什么 是 指向 数组 的 指针 
由 于 数组 和 指针 都 是 派生 类 型 。 我 们 可 以 先 在 它们 前 面 加 上 基本 类 


型 ， 然 后 不 断 添 加 类 型 进行 派生 。 


也 就 是 说 ， 在 派生 出 数组 之 后 ， 再 派生 出 指针 ， 就 能 生成 指向 数组 
的 指针 这 一 类 型 。 


如 果 你 一 听 到 指向 数组 的 指针 ， 就 以 为 : 


是 很 简单 嘛 。 只 要 数组 名 后 不 加 [] ， 那 就 是 指向 数组 的 指 


eh 





那么 请 重读 一 下 1-4-3 市 。 在 表达 式 中 ， 数 组 的 确 会 被 解读 成 指 
a i 
素 的 指针 ”。 


如 果 要 实际 地 声明 一 个 指向 数组 的 指针 ， 则 会 像 下 面 这 样 。 


int (*array_p)[3]; 





array_p 是 指向 int 的 数组 (元 素 个 数 为 3) 的 指针 。 





从 ANS1 C 开始 ， 在 数组 前 加 上 &， 就 可 以 获取 指向 数组 的 指针 
“。 因 此 ， 我 们 可 以 像 下 面 这 文 样 赋值 ， 因 为 类 型 是 相同 的 。 


”这 是 “在 表达 式 中 ， 数 组 都 会 被 解读 成 指向 其 初始 元 素 的 指针 ”这 一 规则 的 一 个 例 
外 。 具 体 请 参考 3-3-3 市 。 


int array[3]; 
int (*array_p)[3]; 





array_p = &array; 《-- 在 数组 前 加 上 &， 获 取 指 向 数组 的 指针 





但 是 ， 如 果 执 行 下 面 这 样 的 赋值 ， 编 译 器 会 报 出 警告 


array_p = array; 


这 是 因为 ，“ 指 向 int 的 指针 ”与 “指向 int 的 数组 元 素 个 
数 为 3) 的 指针 ”是 完全 不 同 的 类 型 。 


然而 ， 如 果 把 它们 看 作 地 址 ， 则 array 和 &array 指向 的 (很 可 
能 ) 是 相同 的 地 址 。 那 么 它们 到 底 有 何不 同 呢 ? 那 就 是 在 使 用 它们 进行 
指针 运算 时 ， 结 果 不 同 。 


在 我 的 机 器 上 ，int 类 型 的 长 度 是 4 字 节 ， 所 以 对 “指向 int 
的 指针 ”加 1， 指 针 会 前 进 4 字 节 。 而 对 于 “指向 int 的 数组 (元 素 
个 数 为 3) 的 指针 ”， 由 于 它 指 向 的 类 型 是 “int (元 素 个 数 为 
3) ”， 其 长 度 为 12 字 节 假设 int 的 长 度 为 4 字 ， 所 以 加 1 
后 ， 指 针 前 进 12 字 节 (图 3-6) 。 


指向 数组 的 指针 


int 的 数组 
( 元 素 个 数 为 3 ) 





加 1 后 指向 这 里 一 一 


图 3-6 对 指向 数组 的 指针 进行 加 法 运算 


会 这 么 用 了 吧 ? 





或 许 有 人 会 有 上 面 的 想法 ， 但 其 实 大 家 经 常 这 么 使 用 ， 只 是 自己 没 
有 察觉 到 而 已 。 


对 此 ， 我 们 将 在 下 一 节 中 进行 说 明 。 
3-2-5 C 语言 中 不 存在 多 维 数组 


应 该 有 很 多 人 以 为 在 6 语言 中 可 以 像 下 面 这 样 声明 多 维 数组 。 


int hoge[3][2]; 


”请 好 好 回忆 一 下 C 语言 声明 的 解读 方法 。 上 面 这 个 声明 应 该 解读 
成 什么 呢 ? 


int 类 型 的 多 维 数组 ? 


不 是 哦 。 应 该 是 “int 的 数组 (元 素 个 数 为 2) 的 数组 〈 元 素 个 数 
为 a 55 , 


也 就 是 说 ， 即 便 5 语言 中 存在 “数组 的 数组 ”， 也 不 存在 多 维 数 


准 | 


组 。 


”在 5 语言 的 标准 文档 中 ，“ 多 维 数组 ”这 个 词 还 是 出 现 过 3 次 之 多 的 ， 所 以 “不 


存在 多 维 数 组 ”的 说 法 可 能 会 让 人 觉得 是 极端 言论 ， 但 如 果 不 这 样 思考 ， 就 很 难 理解 C 语 
言 数据 类 型 的 模型 。 





所 谓 数组 ， 就 是 某 种 类 型 以 一 定 的 个 数 排列 而 得 到 的 类 型 。 “数组 
的 数组 ”只 是 恰巧 其 派生 源 的 类 型 是 数组 而 已 。 也 就 是 说 ，“int 的 数 
组 (元素 个 数 为 2) 的 数组 元素 个 数 为 3) ”可 以 表示 为 图 3-7。 





int int 的 数组 
int 的 数组 (元 素 个 数 为 2) | | 
的 数组 ( 元 素 个 数 为 3 ) ee 


图 3-7 数组 的 数组 


要 点 
0 言 中 不 存在 多 维 数 组 。 


看 起 来 像 多 维 数 组 ， 其 实 是 “数组 的 数组 ”。 





在 有 如 下 声明 时 ， 


int hoge[3][2]; 


可 以 通过 hoge[i][j] 对 其 内 容 进 行 访 问 ， 此 时 hoge[i] 指 的 
是 “int 的 数组 (元 素 个 数 为 2) 的 数组 (元 素 个 数 为 3) ”中 的 第 i 
个 元 素 ， 其 类 型 为 “int 的 数组 (元 素 个 数 为 2) ”。 不 过 ， 由 于 该 数 
组 是 在 表达 式 中 ， 所 以 它 会 被 立刻 解读 为 “指向 int 的 指针 ”。 


关于 这 一 点 ， 我 们 会 在 3-3-5 节 中 进一步 详细 说 明 。 


那么 ， 如 果 将 这 种 “ 仿 多 维 数 组 ”作为 参数 传递 给 函数 ， 会 发 生 什 
么 呢 ? 


如 果 想 将 “int 的 数组 ， 作 为 参数 传递 给 函数 ， 只 需 传 递 “ 指 向 
int 的 指针 ”就 可 以 了 。 这 是 因为 在 表达 式 中 ， 数 组 会 被 解读 为 指针 。 


因此 ， 在 将 “int 的 数组 ”作为 函数 的 参数 传递 时 ， 对 应 的 函数 的 
原型 会 是 下 面 这 样 的 写法 。 


void func(int *hoge); 


假设 我 们 也 以 相同 的 方式 来 考虑 “int 的 数组 (元 素 个 数 为 2) 的 
et 那么 下 面 带 下 划 线 的 部 分 在 表达 式 中 可 以 解 
读 大 绰 十 5 





数组 (元 素 个 数 为 2) 的 数组 (元 素 个 数 为 3) 














因此 ， 只 要 传递 下 面 的 内 容 就 可 以 了 。 


指 回 int 的 数组 (元 素 个 数 为 2) 的 指针 
这 就 是 “指向 数组 的 指针 ”。 
这 惑 意味 着 ， 接 收 该 参数 的 函数 的 原型 就 变 成 了 下 面 这 样 。 
到 现在 为 止 ， 或 许 仍 有 很 多 人 会 将 函数 原型 写成 下 面 这 样 。 
又 或 者 下 面 这样。 
但 其 实 这 些 全 部 都 是 
的 语法 糖 ， 它 们 的 意思 完全 相同 。 
关于 将 数组 作为 参数 传递 时 的 语法 糖 ， 我 们 会 在 3-5-1 节 再 次 说 





O 


3-2-6 ”上 国 数 类 型 的 派生 


函数 类 型 也 是 一 种 派生 类 型 ， 以 “参数 〈 的 类 型 ) ”作为 属性 (图 
96) a 


这 里 整个 表示 返回 信 的 类型 





图 3-8 ”函数 类 型 派生 

但 是 ， 函 数 类 型 与 其 他 的 派生 类 型 稍 有 不 同 。 

不 论 是 int 型 还 是 double 型 ， 抑 或 是 数组 、 指 针 、 结 构 体 ， 只 
要 是 函数 类 型 以 外 的 类 型 ， 其 实体 基本 上 都 可 以 定义 为 变量 。 而 这 些 变 
量 会 占用 一 定 的 内 存 空 间 。 因 此 ， 我 们 能 够 通过 sizeof 运算 符 获取 
它们 的 长 度 。 

像 这 样 可 以 确定 长 度 的 类 型 ， 在 标准 中 被 称 为 对 象 类 型 (object 


type) 。 
然而 ， 孔 数 类 型 不 是 对 象 类 型 。C 语言 中 不 存在 函数 类 型 的 变量 ， 


因而 我 们 无 法 〈 也 没 必 要 ) 确定 其 长 度 。 


我 们 说 过 ， 数 组 类 型 是 由 若干 个 派生 源 类 型 排列 而 成 的 类 型 。 因 
此 ， 数 组 类 型 的 总 长 度 为 : 


派生 源 类 型 的 长 度 X 数 组 的 元 素 个 数 





但 是 ， 由 于 函数 类 型 的 长 度 无 法 确定 ， 所 以 也 就 无 法 从 函数 类 型 派 
生出 数组 类 型 。 也 就 是 说 ， 无 法 创造 出 “函数 的 数组 ”这 种 类 型 。 但 
Ce 类 型 。 只 是 指向 函数 类 型 的 指针 

能 进行 指针 运算 的 ， 因为 我 们 无 法 确定 指针 指向 的 类 型 的 长 度 。 


男 外 ， 消 数 类 型 也 不 能 成 为 结构 体 和 联合 体 的 成 员 。 


总 而 言 之 ， 结 论 就 是 : 


从 函数 类 型 不 能 派生 出 指针 类 型 以 外 的 类 型 。 





但 如 果 是 “指向 函数 的 指针 ”类 型 ， 束 可 以 用 它 生 成 数组 ， 或 者 让 
它 成 为 结构 体 、 联 合体 的 成 员 。 这 是 因为 “指向 函数 的 指针 ”类 型 说 到 
底 是 一 种 指针 类 型 ， 而 指针 类 型 是 对 象 类 型 。 

男 外 ， 孙 数 类 型 也 无 法 从 数组 类 型 派生 


这 是 由 于 ， 函 数 类 型 是 由 “返回 XXX 的 函数 ”的 形式 派生 而 来 的 ， 
而 在 5 语言 中 ， 数 组 无 法 作为 函数 的 返回 值 返回 〈(1-1-11 市 ) 。 


要 扣 


从 函数 类 型 不 能 派生 出 指针 类 型 以 外 的 类 型 。 





从 数组 类 型 不 能 派生 出 函数 类 型 。 





3-2-7 ”计算 类 型 的 长 度 
除了 函数 类 型 与 不 完全 类 型 (3-2-10 节 ) 之 外 的 类 型 都 是 有 长 度 
的 。 


sizeof( 类 型 名 ) 


使 用 上 面 的 写法 ， 编 译 吾 就 会 为 我 们 计算 出 该 类 型 的 长 度 一 一 人 不论 
它 是 多 么 复杂 的 类 型 。 


printf("size..%d\n", (int)sizeof(int(*[5])(double))); 





上 面 这 段 代码 要 输出 的 是 以 下 数组 的 长 度 。 





指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 〈 元 素 个 数 为 5) 


下 面 进行 一 些 练习 ， 模 仿 编译 器 的 处 理 方式 ， 尝 试 计算 一 下 各 种 类 
型 的 长 度 ， 融 当 作 对 前 面 内 容 的 复习 吧 ! 


此 处 ， 我 们 以 使 用 以 下 构成 的 机 器 为 例 思考 一 下 。 


【注意 ! 】 


为 了 方便 说 明 ， 这 里 特意 进行 了 上 述 假设 ， 但 其 实 标准 并 没有 对 
int、double 以 及 指针 的 长 度 进行 任何 规定 ， 它 们 是 取决 于 运行 环 
境 的 。 


因此 ， 我 们 通常 不 应 该 在 意 数 据 类 型 的 物理 长 度 。 请 不 要 写 出 依 





赖 类 型 长 度 的 代码 。 





本 在 计算 类 型 长 度 时 ， 可 以 按 从 前 往 后 的 顺序 ， 像 下 面 这 样 进行 计 
算 。 
)1. 基本 类 型 


基本 类 型 的 长 度 取决 于 运行 环境 。 


)2. 旨 针 


旨 针 的 长 度 取 决 于 运行 环境 ， 并 且 在 大 多 数 情况 下 是 不 受 派 生 
源 的 类 型 影响 的 固定 长 度 。 


)3. 数组 
数组 的 长 度 可 以 通过 派生 源 的 类 型 的 长 度 乘 以 数组 元 素 的 个 数 
得 到 。 
)4. 顺 数 


函数 类 型 的 长 度 无 法 计算 。 
接 下 来 ， 我 们 来 计算 一 下 刚才 提 到 的 下 面 这 个 类 型 的 长 度 。 





指向 返回 int 的 函数 (参数 为 double) 的 指针 的 数组 (元素 个 数 为 5) 


)1. 指向 返回 int 的 函数 〈 人 参数 为 double) 的 指针 的 数组 (元 
素 个 数 为 5) 


册 因为 是 int 类 型 ， 所 以 在 这 里 假设 的 环境 中 ， 计 算 结 果 为 4 
字 节 。 


)2. 





指向 返回 jint 的 函数 “参数 为 double) 的 指针 的 数组 (元 
素 个 数 为 5) 


因为 是 函数 ， 所 以 无 法 计算 长 度 。 

指向 返回 int 的 函数 〈 人 参数 为 double) 的 指针 的 数组 (元 
素 个 数 为 5) 

因为 是 指针 ， 所 以 在 这 里 假设 的 环境 中 ， 计 算 结 果 为 8 字 
7 

指向 返回 int 的 函数 〈 人 参数 为 double) 的 指针 的 数组 (元 
素 个 数 为 5) 


因为 是 派生 源 的 类 型 长 度 为 8 的 “元 素 个 数 为 5 的 数组 ”， 
所 以 计算 结果 为 (8 X 5 三 ) 40 字 节 。 


以 同样 的 方式 计算 各 种 类 型 的 长 度 ， 整 理 可 得 表 3-3。 
表 3-3 计算 各 种 类 型 的 长 度 


4X10=40 


hoge 是 int 的 数组 (元素 个 数 为 10) 字 节 


int hoge 是 指向 int 的 指针 的 数组 (元素 个 数 为 | 8X10=80 
*hoge[16]; 10) 字 节 


double hoge 是 指向 double 的 指针 的 数组 (元 素 个 数 | 8X10=80 
*hoge[10]; 为 10) 字 节 


int hoge[2] hoge 是 int 的 数组 (元素 个 数 3 为 ) 的 数组 4X3X2 一 
(元 素 个 数 2 为 ) 24 字 节 


[3]; 





3-2-8 ”基本 类 型 

派生 类 型 的 基础 是 基本 类 型 (basic type) 。 

关于 基本 类 型 ，C 语言 标准 中 是 这 样 定 义 的 : 类 型 char、 有 符号 
整数 类 型 、 无 符号 整数 类 型 以 及 浮 点 类 型 统称 为 基本 类 型 。 从 099 开 
始 ，_Bool 包含 在 无 符号 整数 类 型 中 ， 同 样 地 复数 类 型 包含 在 浮 点 类 
型 中 。 虽 然 这 么 看 起 来 枚 举 类 型 是 不 包括 在 基本 类 型 中 的 ， 但 在 K&R 
人 


顺便 提 一 下 ,在 C 语言 中 ， 声 明 short int 类 型 的 变量 ， 和 单 
单 声明 short 类 型 的 变量 ， 意 思 是 一 样 的 。 

这 些 内 容 非 常 容易 混淆 ， 所 以 这 里 整理 了 一 张 表 ， 就 整数 类 型 与 浮 
点 类 型 ， 写 明了 什么 样 的 写法 是 允许 的 ， 哪 些 写法 的 意思 是 相同 的 〈 表 
3-4) 。 


表 3-4 整数 类 型 和 浮 点 类 型 的 种 类 


推荐 写法 同 义 的 表现 形式 
本 
oo 


oo 
~ 和 加 EE i 
In 





unsigned short unsigned short int 


unsigned long unsigned long int 


Toms rip (从 C99 开 始 支持 ) Ee long long, long long int, signed 
long long int 


unsigned long long (从 C99 开 始 
支持 ) 


unsigned long long int 


long double 


_Bool (从 C99 开 始 支持 ) 


float _Complex (从 C99 开 始 支 


double _Complex (从 C99 开 始 支 





long double Complex (从 C99 开 
始 支持 ) 


float _Imaginary (从 C99 开 始 支 
持 ) 





double _Imaginary (从 C99 开 始 
支持 ) 

long double _Imaginary (从 C99 
开始 支持 ) 


char 与 signed char 或 unsigned char 中 的 某 一 个 同 义 。 根 
据 标准 ， 默 认 的 char 到 底 是 有 符号 还 是 无 符号 ， 是 由 运行 环境 定义 
的 。 


另外 ， 关 于 这 些 类 型 的 长 度 ， 除 了 sizeof(char) 
(signed、unsigned 同样 ) 被 规定 为 1 以 外 ， 其 他 的 都 是 由 运行 环 
境 定义 的 。 而 关于 char， 也 只 是 规定 了 对 它 使 用 sizeof 之 后 的 返回 
值 为 1， 并 没有 规定 它 一 定 是 8 位 ”<。char 为 9 位 的 运行 环境 在 现实 
中 也 是 存在 的 。 


”规定 的 是 8 位 以 上 。 


3-2-9 ”结构 体 和 联合 体 
在 语法 上 ， 结 构 体 与 联合 体 是 作为 一 种 派生 类 型 进行 处 理 的 。 


然而 ， 我 们 到 目前 的 为 止 的 讲解 都 将 结构 体 、 联 合体 排除 在 外 了 。 
这 么 做 的 理由 如 下 。 


。 结构 体 、 联 合体 虽然 在 语法 上 属于 派生 类 型 ， 但 在 声明 中 它们 与 类 
型 修饰 符 ， 也 就 是 int 或 double 等 处 于 相同 的 位 置 。 

。 当 对 象 仅 限 于 指针 、 数 组 、 函 数 时 ， 还 能 够 使 用 一 维 链 结构 的 表现 
形式 ， 但 一 旦 加 入 了 结构 体 、 联 合体 ， 就 无 法 使 用 链 结构 ， 而 必须 


使 用 树 形 结构 。 


结构 体 是 由 其 他 多 种 类 型 整合 而 成 的 类 型 。 数 组 是 由 相同 类 型 的 多 
个 元 素 排 列 而 成 的 ， 而 结构 体 整合 的 则 是 不 同 的 类 型 。 

联合 体 的 语法 结构 与 结构 体 相似 ， 但 结构 体 是 “排列 地 ”分 配 各 个 
成 员 的 内 存 空 间 ， 而 联合 体 是 “重要 地 ”分 配 。 关 于 联合 体 的 用 途 ， 我 
们 将 在 第 5 章 进行 说 明 。 


如 果 用 “类 型 的 链 式 表 示 ” 来 展现 结构 体 和 联合 体 ， 则 如 图 3-9 
所 示 。 


各 种 各 样 的 类 型 


|_ 


图 3-9 结构 体 类 型 派生 
3-2-10 “不 完全 类 弄 
所 谓 不 完全 类 型 ， 是 指 除 函 数 类 型 外 的 长 度 不 确定 的 类 型 。 
也 就 是 说 ，C 语言 的 类 型 最 终 可 以 分 为 以 下 几 种 。 
。 对 象 类 型 (char、int、 数 组 、 指 针 、 结 构 体 等 ) 
。 函数 类 型 
。 不 完全 类 型 
不 完全 类 型 的 一 个 典型 例子 就 是 结构 体 标签 的 声明 。 


男性 (Man) 可 能 有 妻子 (wife) 。 假 设 将 单身 汉 的 wife 设置 为 
NULL， 那 么 Man 这 个 类 型 可 以 进行 如 下 声明 。 


struct Man tag { 


struct Woman_ tag *wife; /* 妻子 */ 


}; 





此 时 ， 女 性 (Woman) 就 可 以 像 下 面 这 样 进行 声明 。 
struct Woman tag { 
st Man_tag *husband; /* 丈夫 */ 


}; 





在 这 种 情况 下 ，struct Man tag 和 struct Woman_tag 是 相互 
引用 的 ， 因 此 不 论 先 声明 哪 一 个 都 不 行 。 


可 以 像 下 面 这 样 ， 通 过 先 仅 声 明 结 构 体 的 标签 来 回避 这 个 问题 。 





struct Woman_tag; 《<-- 先 仅 声明 标签 
struct Man tag { 

er Woman_tag *wife; /* 妻子 */ 
}; 
struct Woman tag { 

see Man_tag *husband; /* 丈夫 */ 


}; 





ee typedef， 所 以 代码 会 变 成 下 面 





typedef struct Woman_ tag Woman; <-- 先 typedef 标 签 


typedef struct { 
Woman *wife; /* 妻子 */ 


} Man; 


struct Woman tag { 


Man *husband; /* 丈夫 */ 





那么 ， 由 于 在 仅 声 明 标 签 时 ，Woman 类 型 的 内 容 还 是 未 知 的， 所 
ra 这 样 的 类 型 就 称 为 不 完全 类 型 (incomplete 
type) 。 

由 于 不 完全 类 型 的 长 度 是 不 确定 的 ， 所 以 我 们 无 法 将 它 用 于 数组 ， 
也 无 法 将 它 作为 结构 体 的 成 员 ， 或 者 声明 它 的 变量 。 不 过 ， 如 果 仅 是 获 
取 它 的 指针 ， 那 还 是 可 以 做 到 的 。 上 面 的 结构 体 Man 中 就 是 将 Woman 
类 型 的 指针 作为 成 员 使 用 的 。 


然后 ，struct Woman_tag 的 内 容 一 旦 被 定义 ，Woman 融 不 再 是 
不 完全 类 型 了 。 


按照 标准 ，void 类 型 也 属于 不 完全 类 型 。 


前 面 我 们 讲解 了 C6 语言 声明 的 解读 方法 ， 以 及 由 此 得 来 的 类 型 到 
底 是 怎么 一 回 事 。 

本 节 将 对 实际 使 用 这 些 类 型 进行 计算 、 赋 值 和 调用 函数 的 部 分 ， 即 
表达 式 进 行 说 明 。 
3-3-1 表达 式 和 数据 类 型 


虽然 我 们 已 经 在 使 用 “表达 式 ” 这 个 词 了 ， 但 并 没有 明确 地 定义 过 
表达 式 (expression) 。 


首先 ， 表 达 式 中 有 一 种 称 为 基本 表达 式 (pr imary expression) ， 
具体 来 说 就 是 以 下 内 容 。 


。 标识 符 变 量 名 、 孙 数 名 ) 


下 


。 常量 〈 整 数 常量 、 浮 点 数 常量 、 枚 举 常量 、 字 符 常量 ) 
。 字符 串 字面 量 (用 ""” 括 起 来 的 字符 串 ) 
。 用 () 括 起 来 的 表达 式 


另外 ， 通 过 对 表达 式 使 用 运算 符 或 者 通过 运算 符 将 表达 式 与 表达 式 
连接 起 来 得 到 的 也 是 表达 式 。 


也 就 是 说 ，“5” 是 表达 式 ，“hoge” 也 是 表达 式 《前提 是 已 经 声 
明了 hoge 变量 或 函数 ) 。 此 外 ，“5 + hoge” 也 是 表达 式 。 


假如 有 如 下 所 示 的 表达 式 ， 它 的 构造 是 图 3-10 所 示 的 树 形 结构 ， 
而 这 个 树 形 结构 中 的 所 有 子 树 ” 也 都 是 表达 式 。 


* 某 个 特定 节点 (node) 以 下 的 树 。 


仅 这 一 部 分 也 是 表达 式 








整体 当然 也 是 表达 式 


图 3-10 表达 式 的 树 形 结构 


此 外 ， 所 有 的 表达 式 都 具有 类 型 。 
在 3-2 市 中 ， 我 们 提 到 类 型 可 以 通过 链 结构 表示 。 


这 就 意味 着 ， 如 果 所 有 的 表达 式 都 具有 类 型 ， 那 么 就 可 以 在 表示 表 
达 式 的 树 形 结构 的 各 个 节点 加 上 表示 类 型 的 链 (图 3-11) 。 


节点 表示 类 型 的 链 


| 二 


| 


图 3-11 给 所 有 的 表达 式 加 上 类 型 


在 对 表达 式 使 用 运算 符 ， 以 及 将 表达 式 作 为 参数 传递 给 函数 时 ， 表 
达 式 中 持 有 的 类 型 具有 重要 意义 。 


对 于 如 下 数组 ， 

当 使 用 下 面 的 代码 输出 其 内 容 时 ， 

C 语言 初学 者 往往 会 感叹 : “原来 printf() 还 能 这 样 写 啊 ! ” 
的 确 ， 正 如 下 面 这 个 世上 最 著名 的 C 语言 程序 所 示 。 


printf("hello, world\n"); 


$ 


在 大 多 数 情况 下 ，printf() 会 将 字符 串 字 面 量 传递 给 第 1 个 


oO 


然而 ， 如 果 你 看 过 stdio. h 中 的 原型 声明 ， 就 会 发 现 printf() 
的 第 1 个 参数 的 类 型 是 “指向 char 的 指针 ”。 

字符 串 字面 量 的 类 型 是 “char 的 数组 ”， 而 它 又 在 表达 式 中 ， 所 
以 它 的 类 型 就 变 成 了 “指向 char 的 指针 ”。 因 此 ， 我 们 才能 将 字符 串 
字面 量 传 递 给 printf()。 而 上 面 所 写 的 str 也 同样 是 “char 的 数 
组 ”， 也 在 表达 式 中 ， 所 以 也 会 变 成 “指向 char 的 指针 ”， 这 样 一 
来 ， 自 然 就 能 够 将 它 作为 参数 传递 给 printf() 了 。 


不 过 嘛 ， 如 果 只 是 想 输出 字符 串 ， 由 于 当 字 符 串 中 包含 % 时 会 很 
麻烦 ， 所 以 写成 下 面 这 样 ， 或 者 改 用 puts() 或 许 会 更 好 一 些 ， 不 过 
这 又 是 题 外 话 了 。 


printf("%s", str); 


反之 ， 看 到 下 面 的 写法 ， 有 人 会 感到 惊奇 。 


”681234567896ABCDEF" [index] 


但 如 果 写 成 


EE 

恐怕 就 没 人 大 惊 小 怪 了 。 不 论 是 str 还 是 字符 串 字面 量 ， 在 表达 
式 中 * 它们 都 是 “指向 char 的 指针 ”， 因 此 同样 都 可 以 成 为 【] 运算 
符 的 操作 数 。 


“char 的 数组 ”， 但 如 前 所 述 ， 在 表达 式 中 数组 会 被 解读 为 





补充 “对 “表达 式 ” 使 用 sizeof 
sizeof 运 算 符 有 两 种 使 用 方法 。 
一 种 是 : 


sizeof( 类 型 名 ) 





另 一 种 是 : 





sizeof 表达 式 
在 使 用 后 一 种 方法 时 ， 返 回 值 是 表达 式 的 类 型 的 长 度 。 
程序 员 应 该 是 知道 表达 式 的 类 型 的 ， 所 以 我 们 也 可 以 认为 只 
有 “sizeof( 类 型 名 )” 这 一 种 写法 就 够 用 了 ， 但 在 以 下 情况 
下 ，“sizeof 表达 式 ” 的 形式 更 有 优势 。 


。int 不 够 用 而 需要 改 为 long 时 ， 只 需 修 改 少量 代码 
。 获取 数组 的 长 度 
这 里 对 第 二 种 情况 加 以 补充 说 明 。 


int hoge[16]; 


对 于 上 述 声明 ， 如 果 是 在 sizeof(int) 为 4 的 运行 环境 下 ， 


sizeof(hoge) 


返回 40。 因 此 ， 用 它 除 以 sizeof(int)， 就 可 以 得 到 数组 元 素 
的 个 数 。 如 果 考 虑 到 将 来 会 出 现 int 不 够 用 而 需要 改 为 long 的 情 
况 ， 那 么 这 里 不 除 以 sizeof(int)， 除 以 sizeof(hoge[6]) 可 能 
会 更 好 。 


话说 回来 ， 一 个 比较 现实 的 问题 是 ， 在 声明 数组 时 ， 像 “int 
hoge[16];” 这 样 直接 与 上 数值 本 来 就 是 一 种 不 太 好 的 编程 风格 ， 实 
际 上 我 们 应 该 为 数组 的 长 度 起 一 个 合适 的 名 字 ， 然 后 通过 #define 


指定 。 这 样 一 来 ， 就 不 必 到 处 使 用 sizeof 运算 符 ， 直 接 用 那个 
#define 值 就 可 以 了 。 但 是 ， 在 以 下 情况 下 ， 还 是 使 用 sizeof 运 
算 符 更 加 方便 。 


char *color name[] = { 





在 循环 等 中 需要 根据 color_name 的 元 素 个 数 进行 循环 时 ， 使 用 这 个 宏 */ 
#define COLOR COUNT (sizeof(color name) / sizeof(char*)) 








在 这 种 情况 下 ， 由 于 对 数组 进行 了 初始 化 ， 所 以 可 以 例外 地 将 数 
组 元 素 个 数 省 略 “， 于 是 就 没有 地 方 写 #define 的 常量 值 了 。 另 
外 ， 特 别 是 在 这 种 情况 下 ， 以 后 很 可 能 需要 向 color_name 追加 元 
素 ， 所 以 哪怕 是 为 了 到 那 时 只 需 修 改 一 处 就 能 解决 问题 ， 也 应 该 是 使 
用 sizeof 来 计算 长 度 的 方式 更 好 一 些 。 





然而 ，sizeof 运 算 符 说 到 底 也 只 是 通过 询问 编译 器 来 获取 长 度 
的 ， 所 以 只 能 用 于 编译 器 明确 知道 长 度 的 情况 “关于 在 099 中 的 情 
况 ， 留 待 后 文 进行 讲解 ) 。 


extern int hogef[]; 


void func(int hoge[]) 


printf("%d\n", (int)sizeof(hoge)); 





即便 代码 这 样 号 ， 输 出 的 也 只 会 是 指针 的 长 度 〈3-5-15) 。 


另外 ， 到 ANS1 C 为 止 ，sizeof 运 算 符 的 返回 值 都 是 固定 的 〈 在 
编译 时 确定 的 ) ， 但 在 C99 中 ， 由 于 引入 了 可 变 长 数组 〈VLA) ， 所 以 


在 某 些 情况 下 ，sizeof 运 算 符 的 返回 值 是 在 运行 时 决定 的 。 


对 可 变 长 数组 使 用 sizeof 运 算 符 之 后 ， 程 序 能 够 正确 地 返回 指 
定 元 素 个 数 的 数组 的 长 度 。 这 正如 1-4-8 节 的 实验 所 示 。 





3-3-2 什么 是 左 值 一 一 变量 的 两 张 面孔 
假设 有 如 下 声明 。 


此 时 ， 由 于 hoge 是 int 类 型 ， 所 以 只 要 是 能 写 int 类 型 的 值 
的 地 方 ， 就 可 以 像 使 用 常量 一 样 使 用 hoge。 


如 果 将 5 赋值 给 hoge， 那 么 无 论 是 写成 
还 是 写成 

意思 都 一 样 。 这 是 理所当然 的 。 

但 是 ， 在 进行 如 下 的 赋值 时 ， 


即便 此 时 hoge 的 值 是 5， 也 不 能 替换 成 下 面 这 样 的 写法 。 





5 = 10; 


也 就 是 说 ， 变 量 有 了 时 作为 “ 赋 给 该 变量 的 值 ”使 用 ， 有 时 作为 “该 
变量 的 存储 空间 ”使 用 。 


另外 ,在 5 语言 中 ， 除 了 直接 与 变量 名 的 情况 外 ， 有 时 将 运算 符 
用 于 变量 等 的 表达 式 也 可 以 代表 “ 茶 个 变量 的 存储 空间 ”， 比 如 以 下 情 
爷 。 


hoge_p = &hoge; 








*hoge_p = 16; <-- *hoge_p 代 表 hoge 的 存储 空间 


像 这 样 ， 当 表达 式 代表 的 是 某 处 的 存储 空间 时 ， 该 表达 式 就 称 为 左 
值 。 与 此 相对 ， 当 表达 式 仅 代表 值 时 ， 该 表达 式 称 为 右 值 。 


表达 式 中 有 时 存在 左 值 ， 有 时 个 存在 左 值 。 例 如 ， 变 量 名 是 左 值 ， 
而 5 这 样 的 常量 、1 + hoge 这 样 使 用 运算 符 的 表达 式 就 不 是 左 值 。 


补充 “ 左 值 ”的 由 来 


在 C 语 言 之 前 的 大 多 数 语 言 中 ， 当 表达 式 在 赋值 语句 的 左边 时 ， 
该 表达 式 将 被 解释 为 左 值 ， 似 乎 这 就 是 “ 左 值 ” 这 个 词语 的 由 
来 。“ 左 ”在 英语 中 是 left， 因 此 为 了 表示 left value 的 意思 ， 英 语 
中 将 其 称 为 |value。 


但 在 0 语言 中 ，++hoge; 这 样 的 写法 也 是 可 行 的 ， 这 时 的 hoge 指 
的 是 变量 的 存储 空间 ， 不 管 怎么 看 ， 我 们 也 不 会 觉得 它 位 于 “ 左 
边 ”。 因 此 “ 左 值 ”这 个 词 就 显得 不 太 恰 当 。 


标准 化 委员 会 似乎 并 不 认为 lvalue 的 1 是 left 中 的 1， 而 认为 它 是 


locator 〈 表 示 位 置 的 事物 ) 中 的 1， 并 在 Rat ionale 中 这 么 说 : 


不 过 ， 在 JIS X3010 中 ，1value 还 是 被 翻译 成 了 “ 左 值 ””。 


* 在 中 国 国家 标准 GB/T 15272-1994 中 ，1value 也 被 译 为 “ 左 值 ”。 一 一 译 者 注 





3-3-3 ”数组 一 指针 的 转换 
正如 我 们 之 前 反复 说 明 的 那样 ， 在 表达 式 中 ， 数 组 会 被 解读 为 指 
" 


以 如 下 声明 为 例 ， 表 达 式 中 的 hoge 与 &hoge[8] 是 相同 的 意 


/AU O 


int hoge[16]; 


hoge 原本 的 类 型 是 “int 的 数组 (元 素 个 数 为 10) ”， 但 该 类 
型 所 属 的 分 类 “数组 ”会 被 转换 为 “指针 ” 。 


如 果 用 图 表示 ， 那 么 从 数组 类 型 到 指针 类 型 的 转换 过 程 如 图 3-12 
所 示 。 


元 素 沾 雪 信 和 





在 表达 式 中 ， 
类 型 人 被 转 折 


PP ns 


图 3-12 数组 指针 的 转换 


)1. 


但 是 ， 该 规则 有 以 下 例外 情况 。 
当 作为 sizeof 运算 符 的 操作 数 时 


在 以 “sizeof 表达 式 ” 的 形式 使 用 sizeof 运算 符 时 ， 由 于 
这 里 的 操作 数 是 表达 式 ， 所 以 即使 是 对 数组 使 用 sizeof， 数 组 也 
会 被 解读 为 指针 ， 从 而 只 能 获取 指针 的 长 度 一 一 或 许 有 人 是 这 样 认 
为 的 ， 但 其 实在 数组 作为 sizeof 运算 符 的 操作 数 的 情况 下 ， 将 
0 在 这 种 情况 下 返回 的 是 数组 整 


请 参考 3-3-1 刷 的 补充 内 容 。 


)2. 当 作 为 & 运算 符 的 操作 数 时 
在 数组 前 加 上 & 之 后 ， 返 回 的 就 是 指向 数组 整体 的 指针 。 这 
就 是 3-2-4 节 中 解释 过 的 “ 指 同 数组 的 指针 ”。 
)3. 初始 化 数组 时 的 字符 串 字 面 量 
由 于 字符 串 字 面 量 是 “char 的 数组 ”， 所 以 在 表达 式 中 ， 它 
通常 会 被 解读 为 “指向 char 的 指针 ”， 但 关于 初始 化 char 的 
数组 时 的 字符 串 字 面 量 ， 编 译 器 会 将 其 特别 解释 为 花 括 号 内 字符 分 
段 书 写 的 初始 化 列表 的 省 略 形式 〈3-5-4 节 ) 。 请 注意 它 与 初始 化 
char 的 指针 时 的 字符 串 字 面 量 的 区 别 。 
另外 ， 当 数组 被 解读 为 指针 时 ， 该 指针 不 是 左 值 。 
初学 者 可 能 会 写 出 如 下 所 示 的 代码 。 


char str[16]; 
str = "abc"; 
赋值 语句 左边 的 str 原本 是 数组 ， 在 表达 式 中 会 被 解读 为 指针 ， 
但 由 于 它 并 不 是 左 值 ， 所 以 我 们 不 能 对 它 进行 赋值 。 
3-3-4 与 数组 和 指针 相关 的 运算 符 
与 数组 和 指针 相关 的 运算 符 有 如 下 几 种 。 
国 间接 运算 和 从 
单 目 运算 符 * 被 称 为 间接 运算 符 (indirection operator) 。 


* 取 指 针 作为 操作 数 ， 返 回 其 指向 的 对 象 或 函数 。 只 要 返回 的 不 是 
函数 ，* 的 结果 都 是 左 值 。 


* 返回 的 表达 式 的 类 型 就 是 从 操作 数 类 型 中 去 掉 一 个 指针 之 后 的 类 
型 (图 3-13) 。 


PP 


灾 力 从 操作 数 关 开 中 去 近 


生 
一 个 指针 之 后 的 类 型 


图 3-13 ”间接 运算 符 导 致 的 类 型 变化 
甸 地址 运算 符 
单 目 运算 符 & 被 称 为 地 址 运算 符 (address operator) 。 


& 取 左 值 作为 操作 数 ， 返 回 指向 该 左 值 的 指针 ， 其 类 型 为 操作 数 类 
型 加 上 一 个 指针 之 后 的 类 型 (图 3-14) 。 


Hh 


图 3-14 地址 运算 符 导 致 的 类 型 变化 

地 址 运算 符 不 能 取 非 左 值 的 表达 式 作为 操作 数 。 
晶 下 标 运 算 符 

后 置 运算 符 [] 被 称 为 下 标 运算 符 。 

[] 取 指 针 和 整数 作为 操作 数 。 


p[i] 是 








*(p + i) 
的 语法 糖 ， 除 此 以 外 没有 任何 意义 。 
在 以 a[i] 访问 声明 为 int a[186]; 的 数组 时 ， 由 于 a 在 表达 


式 中 ， 所 以 它 会 被 解读 为 指针 。 因 此 通过 取 指 针 和 整数 作为 操作 数 
的 ) 下 标 运算 符 ， 我 们 可 以 访问 数组 。 

表达 式 p[i] 其 实 就 等 同 于 *(p + i)， 所 以 其 返回 类 型 为 从 p 
的 类 型 去 挥 一 个 指针 之 后 的 类 型 。 


四 -> 运算 符 


关于 -> 运算 符 ， 在 标准 中 似乎 也 只 是 提 到 了 “- > 运算 符 ”， 而 
在 JIS X3010 的 索引 中 ， 它 被 称 为 “结构 体 或 联合 体 指针 运算 符 ”， 
在 1S0/1EC 9899:2011 的 索引 中 则 被 称 为 arrow operator*。 我 们 有 
时 也 称 之 为 “箭头 运算 符 ”。 


”在 中 国 国家 标准 GB/T 15272-1994 中 ， 被 称 为 “结构 或 联合 指针 运算 符 ”。 一 一 译 





在 通过 指针 引用 结构 体 的 成 员 时 ， 需 要 用 到 -> 运算 符 。 


Prose; | 


旺 
和 让 


Cree | 
的 语法 糖 


以 上 代码 通过 *p 的 * 从 指针 p 获取 了 结构 体 的 实例 ， 从 而 引用 
了 其 成 员 hoge。 


3-3-5 多维 数组 
在 3-2-5 布 中 ， 我 们 说 过 C6 语言 中 不 存在 多 维 数 组 。 
看 似 多 维 数组 的 其 实 是 “数组 的 数组 ”。 


这 样 的 “多 维 数 组 ”仿造 版 〉 通 常 是 通过 hoge[i][j] 访问 


的 ， 那 么 此 时 会 发 生 什 么 呢 ? 下 面 我 们 来 看 一 下 。 


假设 有 如 下 所 示 的 “数组 的 数组 ”， 我 们 通过 hoge[i][j] 的 形 


式 对 它 进 行 访问 (图 3-15) 。 


int hoge[3][5]; 


hoge 的 类 型 为 “int 的 数组 元素 个 数 为 5) 的 数组 元 素 个 数 
为 3) 55 


然而 ， 由 于 是 在 表达 式 中 ， 所 以 数组 会 被 解读 为 指针 。 因 此 ，hoge 
的 类 型 变 为 “指向 int 的 数组 (元 素 个 数 为 5) 的 指针 ”。 


hoge[i] 是 *(hoge + i) 的 语法 糖 。 


给 指针 加 i 就 意味 着 指针 将 前 进 该 指针 所 指 类 型 的 长 度 X 
i 的 距离 。 由 于 hoge 指向 的 类 型 为 “int 的 数组 〈 元 素 个 数 为 
5) ”， 所 以 hoge + i 将 使 指针 前 进 sizeof(int[5]) * i 的 
距离 。 

中 通过 * (hoge + i) 的 *， 一 个 指针 会 被 去 掉 。 因 此 * 
(hoge + i) 的 类 型 就 变 为 “int 的 数组 (元 素 个 数 为 5) ”。 


(3) 但 由 于 是 在 表达 式 中 ， 所 以 数组 会 被 解读 为 指针 。 最 终 * 
(hoge + ii) 的 类 型 为 “指向 int 的 指针 ”。 


(*(hoge + 评 ))[j] 等 同 于 *((*(hoge + i)) + j)。 
此 ，(*(hoge + i))[j] 就 是 对 指向 int 的 指针 加 j 后 得 到 的 
地 址 上 的 内 容 ， 类 型 为 int。 


以 hoge [i] [j] 中 的 i == 2， 
j == 3 的 情况 为 例 


1. 声明 int hoge[3] [5] ; 
在 内 存 中 的 状态 
2. hoge 指 向 这 里 一 人 



















int 的 数组 
( 元 素 个 数 为 5 ) 
3-D 
由 于 hoge 是 int 的 数组 
( 元 素 个 数 为 5 ) 的 指针 ， 六 
上 > 二 > En AN "ge 
人 利用 * 去 掉 指 针 ， 
变 为 此 处 的 数组 
3-G) 
但 由 于 是 在 表达 式 中 ， 


所 以 数组 会 被 解读 为 指 
针 ( 指向 int 的 指针 ) 





4. 对 int 的 指针 进行 加 法 运算 ， 
取出 实际 数据 


图 3-15 访问 多 维 数组 


某 些 语言 会 以 array[i,j] 的 写法 来 支持 多 维 数 组 ”。 


”比如 Pascal 、0# 等 。Pascal 中 的 多 维 数组 只 不 过 是 “数组 的 数组 ”的 语法 糖 而 


已 ， 而 0# 中 的 多 维 数 组 与 “数组 的 数组 ”被 称 为 交错 数组 ) 是 完全 不 同 的 东西 。 





0 语言 中 虽然 没有 多 维 数 组 ， 但 因为 可 以 用 “数组 的 数组 ”替代 ， 
所 以 倒 也 没有 什么 不 便 。 但 是 ， 如 果 反 过 来 只 有 多 维 数组 而 没有 “数组 
的 数组 ”， 反 而 会 让 人 困扰 。 


比如 ， 将 某 人 一 整 年 的 每 日 工作 时 间 以 如 下 的 “数组 的 数组 ”形式 
表示 ”: 


”这 里 假定 月 和 日 从 零 开始 计数 ， 在 输出 时 再 进行 相应 的 修正 。 遇 到 二 月 等 情况 ， 数 


组 会 和 消 有 元 余 ， 我 们 暂且 不 考虑 这 些 。 





int working time[12][31]; 


此 处 假设 有 函数 可 以 根据 一 个 月 的 工作 时 间 计 算出 薪资 等 ， 现 在 我 
们 以 如 下 方式 将 某 月 的 工作 时 间 传 递 给 该 函数 。 


calc_salary(working time[month]); 


calc_salary() 的 原型 如 下 所 示 。 


int calc salary(int *working time); 


正 是 由 于 working time 不 是 多 维 数组 而 是 “数组 的 数组 ”， 我 
们 才能 使 用 这 种 技巧 。 


补充 “运算 符 的 优先 级 
0 语言 拥有 为 数 众多 的 运算 符 ， 且 其 优先 级 多 达 16 级 。 


由 于 同 其 他 语言 相 比 ，C 语 言 的 优先 级 数量 极 多 ， 所 以 大 多 数 的 C 
语言 参考 书 中 会 有 像 表 3-5 这 样 的 优先 级 列表 。 


表 3-5 运算 符 的 优先 级 列表 


结合 规则 


--(type name){list} (从 





后 置 运 算 符 C99 开 始 支持 ) 往 左 


& sizeof 
和 E 
(type name) 


右 
右 

王 

: EE 

乐 /2 

| J 

< 

左 

左 


管 族 


关系 运算 符 


大 大 大 人 左 
逻辑 与 运算 符 8&& 人 


不 
不 
不 
不 


从 
往 左 

从 
往 左 

从 
得 5 

从 
往 右 

从 
4 3 

从 
往 左 

从 
7 在 

从 
往 右 

从 
往 2 

从 
往 右 





逻辑 或 运算 符 


条 件 运 算 符 


赋值 运算 符 


运 号 运算 符 





关于 这 之 中 优先 级 “最 高 ”的 〈)， 似 乎 有 许多 人 持 有 以 下 再 


() 是 程序 员 无 视 语 法 规定 的 优先 级 ， 强 制 设置 优先 级 时 使 用 
的 运算 符 。 所 以 它 的 优先 级 当然 是 最 高 的 。 





但 这 是 对 它 的 误解 。 


本 来 嘛 ， 如 果 这 个 () 是 这 个 意思 ， 那 就 根本 没 必要 特地 把 它 写 
进 优先 级 列表 里 了 。 


该 表 中 的 〈) 是 代表 隐 数 调用 的 运算 符 ， 这 种 情况 下 的 优先 级 表 
示 的 是 表达 式 func(a，b) 中 func 与 (a，b) 之 间 结 合 的 强度 。 


另外 ，K&R 中 也 有 同样 的 表格 〈 见 该 书 2. 12 节 ， 这 里 引用 至 表 
3-6) 。 


表 3-6 K&R 中 的 运算 符 优 先 级 列表 〈 该 表 存 在 许多 问题 


ER 


从 左 往 右 


十 三 -二 *= /= %= &= 和 人 = 一 一 一 伏 才 从 天 





as 


注 : 单 目 运算 符 +、- 和 * 的 优先 级 比 相应 的 双 目 运算 符 高 。 


在 K&R 的 优先 级 列表 中 ，++ 与 -- 只 在 单 目 运算 符 的 地 方 有 
所 记载 。 这 样 一 来 ， 在 运用 指针 运算 的 编码 中 很 常见 的 如 下 表达 式 


5 
*p++， 


就 分 不 清 这 里 到 底 是 对 p 进行 自 增 ， 还 是 对 p 指向 的 内 容 
(*p) 进行 自 增 了 。 关 于 这 一 点 ， 过 去 常 看 到 下 面 这 样 的 解释 。 


* 与 ++ 的 优先 级 是 相同 的 。 但 是 ， 由 于 结合 规则 是 从 右 往 左 
的 ， 所 以 p 会 先 与 ++ 结 合 。 因 此 ， 自 增 的 并 非 是 *p， 而 是 p。 





不 说 别 的 ， 就 连 K&R 也 是 这 样 解释 的 〈 见 该 书 5. 1 节 ) 。 但 是 ， 
如 表 3-5 所 示 ， 由 于 后 置 的 ++ 的 优先 级 比 单 目 运算 符 * 还 要 
高 ， 所 以 这 里 根本 没有 必要 抬 出 结合 规则 来 说 明 问 题 。 从 这 个 意义 上 
来 说 ，K&R 的 说 明 是 略 有 不 当 的 。 


标准 中 虽然 没有 像 表 3-5 这 样 的 优先 级 列表 ， 但 它 通 过 
BNF (Backus-Naur Form， 巴 科斯 范式 ) 定义 了 语法 规则 ， 运 算 符 的 
优先 级 也 包含 在 语法 规则 中 。 通 过 该 语法 规则 可 以 看 到 ， 后 置 的 ++ 比 
前 置 的 ++ 或 * 的 优先 级 更 高 〈 顺 便 说 一 下 ， 在 K&R 的 优先 级 列表 中 ， 
单 目 运算 符 的 优先 级 与 强制 类 型 转换 运算 符 相 同 ， 这 一 点 也 与 标准 有 
0 K&R 的 2. 12 节 中 所 写 的 运算 符 优 先 级 列表 实在 是 挺 
瑟 忆 HYJo 


不 过 ，K&R 在 A. 13 中 记载 的 语法 规则 还 是 非常 符合 标准 的 。 


记得 在 写作 本 书 第 1 版 时 ， 我 曾 看 到 过 书店 里 陈列 的 C 语 言 书 中 的 


而 那些 列表 大 多 数 是 从 K&R 原封 不 动 地 照搬 过 去 


时 至 今日 ， 不 论 是 书本 上 还 是 网 络 上 的 讲解 ， 大 多 已 经 能 够 将 后 
置 的 ++ 区 分 出 来 了 。 这 让 人 不 禁 感慨 : 大 家 终于 逐渐 摆脱 K&R 的 束缚 





3-4-1 const 修饰 符 


const 是 ANSI1 C 中 增加 的 类 型 修饰 符 ， 用 于 修饰 类 型 ， 表 示 其 
为 只 读 。 


| 名 不 副 实 的 是 ，const 并 不 一 定 代表 常量 。 const 最 重要 的 用 途 
就 是 修饰 函数 的 参数 ， 但 如 果 函 数 的 参数 是 常量 ， 那 就 没有 必要 去 传递 
它 了 。const 其 实 只 是 修饰 标识 符 〈 变 量 名 ) 的 类 型 ， 表 示 它 是 只 读 

的 而 已 。 


/* const 参 数 的 典型 示例 */ 
char *strcpy(char *dest, const char *src); 


strcpy() 是 持 有 被 指定 为 const 的 参数 的 函数 的 典型 示例 ， 此 
时 只 读 的 是 什么 呢 ? 


做 个 实验 就 可 以 明白 : 在 上 述 示例 中 ， 变 量 src 并 没有 变 为 只 
读 。 
char *my_strcpy(char *dest, const char *src) 


{ 
} 





src = NULL; <-- 即使 给 src 赋 值 ， 编 译 器 也 不 会 报错 

















这 时 变 为 只 读 的 并 不 是 src， 而 是 src 指向 的 地 址 中 的 内 容 。 


char *my_strcpy(char *dest, const char *src) 





如 果 想 将 src 本 身 设 为 只 读 ， 必 须 写 成 下 面 这 样 。 


char *my_strcpy(char *dest, char * const src) 
{ 

src = NULL; <-- 报错 ! 
} 





如 果 想 将 src 与 src 指向 的 地 址 中 的 内 容 都 设 为 只 读 ， 可 以 写 
成 下 面 这 样 。 


char *my_strcpy(char *dest, const char * const src) 
{ 
src = NULL; <-- 报错 ! 


*src = 'a'; 《<-- 报错 ! 


} 





实际 上 ，const 大 多 用 于 当 参 数 为 指针 时 ， 将 指针 指向 的 地 址 中 
的 内 容 设 为 只 读 。 


通常 C 语言 的 参数 都 是 值 传递 的 ， 因 此 不 论 被 调用 万 对 参数 进行 
什么 样 的 更 改 ， 都 不 会 对 调用 方 产生 影响 。 如 果 想 要 对 调用 方 的 变量 施 
加 影响 〈“ 通 过 参数 返回 函数 内 的 某 些 值 ) ， 可 以 将 指针 作为 参数 传递 ， 
然后 对 指针 指向 的 内 容 进行 更 改 。 


但 在 上 述 示例 (my_strcpy) 中 传递 的 是 src 这 个 指针 。 这 里 其 

实 真 正 想 要 传递 的 是 字符 串 ， 即 char 的 数组 ， 但 由 于 在 C 语言 中 无 

法 将 数组 作为 参数 传递 ， 所 以 不 得 已 只 能 将 指向 数组 初始 元 素 的 指针 传 

人 
违 指 


问题 是 ， 这 种 情况 很 容易 与 “为 了 从 函数 返回 值 而 传递 指针 ”的 情 
况 混 消 。 


此 时 ， 如 果 在 原型 声明 中 加 入 const， 我 们 就 可 以 提出 以 下 主 
张 。 


这 个 函数 虽然 能 够 接收 指针 作为 参数 ， 但 不 能 改写 指针 指 癌 的 





也 就 是 说 ， 


“这 里 虽然 接收 了 指针 ， 但 并 不 是 为 了 向 调用 方 返回 某 些 值 。” 





可 以 说 ，strcpy() 通过 该 原型 声明 表明 了 “对 strcpy() 来 说 
src 是 输入 ， 其 指向 的 对 象 不 能 被 改写 ”的 意图 。 


我 们 可 以 按照 以 下 规则 解读 包含 const 的 声明 。 


QD 按照 3-1-2 节 中 提 到 的 规则 ， 从 标识 符 开始 ， 依 次 由 内 向 外 
地 使 用 英语 解读 声明 。 


如 果 已 解读 部 分 的 左 侧 出 现 了 const， 就 在 当前 位 置 追加 
read- only。 


(3 如 果 已 解读 部 分 的 左 侧 出 现 了 类 型 修饰 符 ， 并 且 其 左 侧 有 
const， 就 暂且 跳 过 类 型 修饰 符 ， 追加 read-only。 


由 个 描 长 英语 的 读者 ， 在 翻译 成 中 文 时 请 注意 : read-only 修 
饰 的 是 紧 跟 其 后 的 单词 。 





因此 ， 


char * const src; 


可 以 解读 为 : 


src is read-only pointer to char 
四 src 是 指向 char 的 只 读 的 指针 





char const *src; 


可 以 解读 为 ; 


src is pointer to read-only char 
号 src 是 指 铝 《只 读 的 char〉 的 指针 


而 最 容易 让 人 混淆 的 是 ， 


char const *src 


const char *src 


意思 完全 相 同 [e 


3-4-2 ”如 何 使 用 const ? 可 以 用 到 哪 种 程度 


我 们 经 党 可 以 看 到 一 些 工 程 文件 在 函数 的 头 部 注释 中 为 参数 加 上 
(i)、(0)、(i/o) 等 标记 。 


下 面 举 一 个 有 点 矫 揉 造作 但 比较 典型 的 例子 。 


St dd i 


* void search point(char *name, double *x, double *y) 


* 


功能 : 


米 
* 人 参数 : 
米 
米 




















以 名 称 为 关键 字 搜 索 “ 点 ”， 返 回 其 坐标 
(i) name 名 称 〈 搜 索 关 键 字 ) 

(o) x XxX 坐标 

(o) y YY 坐标 














i A 


不 过 ， 


由 于 这 种 头 部 注释 写 起 来 实在 是 很 麻烦 ， 所 以 也 会 发 生 把 其 


他 函数 的 头 部 注释 复制 过 来 之 后 志 记 修改 ， 结 果 导 致 错误 百出 的 情况 ， 
而 且 这 里 面 的 信息 几乎 都 已 经 写 在 下 万 的 浮 数 接口 里 了 ， 所 以 也 总 会 让 
a 不 过 这 些 我 们 暂且 按 下 不 

虽然 这 里 在 注释 中 写 着 (i)、(o) 之 类 的 信息 ， 但 编译 器 对 此 是 
不 加 以 任何 考虑 的 。 


对 此 ， 如 果 将 search_point() 的 原型 声明 为 下 面 这 样 。 


void search point(char const *name, double *x, double *y); 


那么 当 错 误 地 对 name[i] 赋值 时 ， 编 译 器 会 准确 地 为 我 们 报 出 警 
告 。 因 此 ， 与 其 在 注释 中 写 上 (i)、(o) 之 类 的 信息 ， 还 不 如 使 用 
const 更 加 可 靠 一 些 *。 


”在 不 使 用 const 时 ， 偶 尔 会 发 生 下 面 这 种 令 人 困扰 的 情况 : 由 于 写 着 (i)， 所 以 


安安 心心 地 把 指针 传递 给 了 函数 ， 结 果 指 针 指 向 的 内 容 在 函数 内 被 改写 了 。 





上 面 的 char const *name 不 能 赋值 给 普通 的 char* 类 型 的 变 
量 〈 除 非 进 行 强制 类 型 转换 ) 。 这 是 理所当然 的 ， 因 为 如 果 单 纯 地 将 它 
赋值 给 char* 类 型 的 变量 ， 之 后 就 可 以 随心 所 欲 地 改写 它 指向 的 地 址 
中 的 内 容 了 ， 这 样 一 来 const 就 毫 无 意义 了 。 


同 理 ， 也 不 能 将 char const* 类 型 的 指针 传递 给 参数 为 char* 
的 函数 。 因 此 ， 如 果 将 指针 类 型 的 参数 指定 为 const， 那 么 这 一 层 以 
下 的 所 有 函数 就 都 需要 引入 const*。 


”在 通用 的 库 函 数 中 ， 本 该 加 const 的 参数 却 没有 ， 从 而 导致 调用 方 无 法 使 用 


const 的 情况 比比 皆 是 。 





下 面 我 们 假设 有 这 样 一 个 结构 体 。 


typedef struct { 
char *title; /* 书 名 */ 
int price; /* 价格 */ 
char isbn[32]; /* ISBN */ 





} BookData; 


将 其 接收 为 输入 人 参数 的 函数 的 原型 可 以 写成 下 面 这 样 。 


/* 登记 图 书 的 数据 */ 
void register book(BookData const *book data) ; 


由 于 加 上 了 const， 所 以 book_data 指向 的 对 象 是 禁止 写 入 的 。 
这 样 应 该 就 可 以 高 枕 无 忧 地 传递 BookData 了 ……: 


然而 ， 其 实 接收 方 是 可 以 改写 图 书 标题 (book_data->title) 所 
指向 的 地 址 中 的 内 容 的 。 

之 所 以 出 现 这 样 的 情况 ， 是 由 于 被 const 指定 为 只 读 的 说 到 底 只 
是 “book_data 指向 的 内 容 ”， 而 并 非 “book_data 指向 的 内 容 再 进 
一 步 指向 的 内 容 ” (图 3-16) 。 


它 所 指向 的 对 象 为 这 是 这 不 是 
read-only read-only 的 read-only 的 ! 


LTTTTT 








图 3-16 ”const 的 界限 
要 是 因为 这 样 就 把 Book_Data 结构 体 整 个 写成 下 面 这 样 。 


typedef struct { 试 着 写成 了 const 
char const *title; /* 书 名 */ 
int price; /* 价格 */ 
char isbn[32]; /* ISBN */ 


} BookData; 


那 可 就 没 人 能 对 title 指向 的 内 容 进 行 写 入 了 ”。 


”虽然 说 在 这 种 情况 下 即使 不 能 改写 也 没什么 问题 





也 正 因 为 如 此 ， 有 人 对 const 在 现实 中 到 旗 能 够 给 我 们 带 来 多 少 
便利 是 持 怀疑 态度 的 。 


补充 const 可 以 代替 #define 吗 


在 5 语言 中 定义 常量 时 ， 通 常会 像 下 面 这 样 使 用 预 处 理 器 的 安 
功能 。 


#define HOGE SIZE (166) 
int hoge[HOGE SIZE]; 
但 是 ， 由 于 预 处 理 器 的 宏 是 独立 于 5 语言 语法 的 ， 所 以 这 会 给 


调试 等 工作 带 来 一 定 困难 。 当 宏 定义 中 有 拼写 错误 时 ， 往 往 要 到 展开 
宏 的 地 方才 会 报 出 错误 ， 所 以 要 查 明 错误 原因 是 很 困难 的 。 


那么 ， 既 然 宏 是 如 此 邪恶 之 物 ， 还 不 如 尽 可 能 地 不 要 去 使 用 它 ， 
来 琢磨 一 下 可 不 可 以 写成 下 面 这 样 。 


const int HOGE_SIZE = 166; 
int hoge[HOGE SIZE]; 


很 遗憾 ， 答 案 是 不 可 以 。 





虽然 在 6 语言 中 数组 的 元 素 个 数 必须 是 常量 ， 但 被 指定 为 
const 的 标识 符 其 实 只 不 过 是 具有 只 读 属 性 而 已 ， 它 本 身 并 不 是 常 
量 ， 所 以 无 法 用 于 定义 数组 元 素 的 个 数 “。 由 于 C99 中 的 VLA 功能 
已 经 使 得 变量 也 可 以 用 来 定义 自动 变量 的 数组 的 元 素 个 数 了 ， 所 以 被 


指定 为 const 的 标识 符 也 能 够 用 于 定义 元 素 个 数 ， 不 过 全 局 变量 和 
static 还 是 一 样 不 能 用 于 定义 元 素 个 数 。 


* 不 过 如 果 是 C++， 就 另 当 别论 了 。 





3-4-3 typedef 
typedef 功能 用 于 为 某 个 类 型 定义 别名 。 


例如 ， 下 面 的 声明 就 代表 以 后 对 于 “指向 char 的 指针 ”这 个 类 
型 ， 可 以 使 用 String 这 个 别名 。 


typedef char *String; 


可 以 按照 与 通常 的 变量 声明 相同 的 顺序 解读 typedef。 对 于 上 例 
中 的 String， 可 以 将 其 视 同 变量 名 ， 以 英语 语序 解读 为 如 下 内 容 。 


String is pointer to char 
中 String 是 指向 char 的 指针 





由 此 ，String 被 声明 为 “指向 char 的 指针 ”这 个 类 型 的 别名 。 
而 后 ， 当 要 使 用 string 时 ， 可 以 写成 下 面 这 样 。 


String hoge[16]; 
这 意味 着 : 


hoge is array〔 元 素 个 数 为 6) of String 


只 hoge 是 String 的 数组 《元素 个 数 为 16) 





如 果 将 这 里 的 String 的 部 4 分 机 械 弛 葵 换 威 被 定义 为 String 类 
型 的 “指向 char 的 指针 ”， 则 对 声明 的 解读 就 会 变 成 下 面 这 样 。 


hoge is array〔 元 素 个 数 为 16) of pointer to char 
号 hoge 是 指向 char 的 指针 的 数组 (元 素 个 数 为 10) 

















六 上 
但 从 意思 上 来 看 ， 怎么 也 看 不 出 typedef 用 于 指定 “存储 类 ”。 其 
实 ，typedef 之 所 以 被 归 类 为 存储 类 说 明 符 ， 应 该 是 因为 用 它 指定 类 
型 的 语法 沿用 了 通常 的 标识 符 声明 语法 。 


要 点 
可 以 按照 与 通常 的 变量 声明 相同 的 方式 解读 typedef。 
它 所 声明 的 不 是 变量 或 函数 ， 而 是 类 型 的 别名 。 





我 在 声明 结构 体 的 时 候 总 会 加 上 typedef， 同 时 也 会 尽 可 能 地 省 
略 标 签 ”。 


”也 有 人 不 认同 这 种 编程 风格 





typedef struct { 
} Hoge; 


本 上 面 这 个 声明 其 实 并 没什么 特别 之 处 ， 假 设 将 结构 体 写成 下 面 这 


struct Hoge tag { 
} hoge; 


那么 这 里 就 声明 了 struct Hoge_tag 类 型 的 变量 hoge。 如 果 将 
相当 于 变量 名 的 部 分 替换 成 类 型 的 名 称 ， 并 在 开头 加 上 typedef， 该 
声明 就 会 变 成 typedef 的 声明 。 


另外 ， 在 声明 变量 时 ， 可 以 像 下 面 这 样 一 次 性 声明 多 个 变量 。 
同样 地 ，typedef 也 可 以 同时 声明 多 个 类 型 的 别名 。 


不 过 这 么 做 只 会 使 代码 变 得 星 涩 难 懂 ， 并 没什么 荔 处 ， 但 偶尔 还 是 
会 看 到 如 下 声明 。 


typedef struct { 
} Hoge, *HogeP; 
这 其 实 与 下 面 的 写法 是 一 个 意思 。 


typedef struct { 


} Hoge; 


typedef Hoge *HogeP; 





另外 ， 在 C99 中 ， 对 可 变 长 数组 〈VLA) ， 也 可 以 进行 
typedef。 


如 下 所 示 进 行 typedef 之 后 ， 就 可 以 通过 sizeof(Array) 获知 
Array 的 长 度 了 。 


typedef int Array[size]; 


当然 ， 用 上 面 获取 的 长 度 除 以 sizeof(int)， 就 可 以 计算 出 数组 
的 元 素 个 数 size 了 。 


另外 ， 如 下 所 示 ， 即 使 在 typedef 之 后 改变 变量 size 的 
值 ，sizeof(Array) 的 值 也 不 会 发 生变 化 。 

















void func(int size) <-- 假设 以 size = 5 调用 
{ 
typedef int Array[size]; 


printf("sizeof Array..%d\n",，(int)sizeof(Array));<-- 若 int 为 4 字 节 
size = 10; 
printf("sizeof Array..%d\n"，(int)sizeof(Array));<-- 依然 显示 26 





3-5-1 上 函数 形 参 的 声明 (ANS1 C6 版 ) 
在 5 语言 中 ， 我 们 可 以 通过 以 下 形式 声明 函数 的 形 参 。 


void func(int af[]) 
{ 





} 


这 种 写法 看 上 去 好 像 是 要 将 数组 传递 给 参数 。 


但 在 5 语言 中 ， 我 们 是 不 能 将 数组 作为 参数 传递 给 函数 的 ， 此 时 
传递 的 只 不 过 是 指向 数组 的 初始 元 素 的 指针 而 已 。 


在 函数 形 参 的 声明 中 ， 作 为 类 型 分 类 的 数组 会 被 解读 为 指针 。 


void func(int a[]) 
{ 





} 


会 被 自动 地 解读 成 


void func(int *a) 
{ 


这 时 就 算 与 上 数组 元 素 的 个 数 ， 也 会 被 忽略 。 


需要 注意 的 是 ,在 5 语言 中 ， 只 有 在 这 种 情况 下 ，int a[] 与 
int *a 才 代表 相同 意思 。 请 同时 参考 3-5-3 节 的 内 容 。 


要 点 
【非常 重要 ! 】 


只 有 在 声明 函数 形 参 的 情况 下 ，int a[] 与 int *a 才 具 有 相 
同 的 意义 。 





下 面 是 一 个 稍微 复杂 一 点 的 形 参 声明 的 例子 。 


void func(int a[][5]) 


a 的 类 型 为 “int 的 数组 (元 素 个 数 为 5) 的 数组 元 素 个 数 不 
详 ) ”， 所 以 它 会 被 解读 为 “指向 int 的 数组 元 素 个 数 为 5) 的 指 
针 ”。 因 此 ， 它 原本 的 意思 其 实 是 下 面 这 样 。 


void func(int (*a)[5]) 


与 一 维 数 组 的 情况 相同 ， 就 算 像 下 面 这 样 写 上 元 素 个 数 〈3) ， 元 
素 个 数 也 会 被 忽略 。 


void func(int a[3][5]); 


另外 ， 对 于 多 维 数 组 〈 数 组 的 数组 ) ， 只 有 最 外 层 的 数组 〈 作 为 
类 型 分 类 的 数组 ) 会 被 解读 为 指针 。 因 此 ， 下 面 的 写法 是 不 允许 的 。 


void func(int a[][]); 


补充 K&R 中 关于 函数 形 参 声明 的 说 明 
在 K&R 的 5.3 节 中 ， 有 如 下 摘 述 。 


在 函数 定义 中 ， 形 式 参 数 


和 


是 等 价 的 。 我 们 通常 更 习惯 于 使 用 后 一 种 形式 ， 因 为 它 比 前 者 
更 直观 地 表明 了 该 参数 是 一 个 指针 。 


这 段 叙 述 本 身 可 能 并 ; 受 有 什么 错误 。 但 在 K&R 中 ， 这 段 叙 述 是 
在 说 明了 *(pa + i) 与 pa[i] 具有 同等 意义 之 后 ， 突 然 冒 出 来 
的 。 这 样 很 容易 使 人 漏 看 开头 的 “在 函数 定义 中 ， 形式 参数 ”这 一 重 
要 的 前 提 条 件 ”。 


* 在 原 书 中 ，“ 在 函数 定义 中 ， 形 式 参 数 ” (As formal parameters in a 
function definition) 这 人 句 话 正好 在 页 尾 ， 这 又 增 大 了 读者 漏 读 的 可 能 ' 


再 加 上 ， 本 例 又 不 知 为 何在 代码 的 右边 加 上 了 分 号 。 在 ANSI 0 
的 函数 定义 中 ， 形 参 的 声明 一 般 是 不 加 分 号 的 。 难 道 是 此 处 需要 使 用 
过 去 的 5 语言 写法 ? 或 者 是 改版 时 瑟 记 修改 了 ? 


”这 并 非 翻译 过 程 中 的 误 写 ， 原 书本 身 就 有 分 号 。 





ER 


更 糟糕 的 是 ， 在 K&R 中 ， 紧 接着 又 出 现 了 下 面 这 段 话 。 


如 果 将 数组 名 传递 给 函数 ， 函 数 可 以 根据 情况 判定 是 按照 数组 
处 理 还 是 按照 指针 处 理 ， 随 后 根据 相应 的 方式 操作 该 参数 。 





反正 我 是 费 了 很 大 的 劲 去 读 它 ， 结 果 还 是 完全 疫 弄 明日 它 的 意 
思 。 真 相应 该 是 下 面 这 样 。 


ee 表达 式 中 的 数组 会 被 解读 为 “指向 初始 元 素 的 指 

ee 所 以 数组 会 被 解读 为 “指向 初始 元 素 
已 十? 

。 因 此 ， 最 终 传递 给 函数 的 束 是 指针 。 


0 语言 并 不 具备 “根据 情况 判定 是 按照 数组 处 理 还 是 按照 指针 处 
理 。 这 样 靖 妙 的 功能 。 作 为 参数 传递 给 函数 的 ， 始 终 都 是 指针 。 


实际 上 ， 前 面 的 引文 也 提 到 : 


我 们 通常 更 习惯 于 使 用 后 一 种 形式 ， 因 为 它 比 前 者 更 直观 地 表 
明了 该 参数 是 一 个 指针 。 





这 种 说 法 让 人 感到 不 可 思议 ， 人 们 难免 会 像 下 面 这 样 想 。 


如 果 连 C 语言 的 作者 自己 都 觉得 后 者 的 写法 更 好 ， 那 么 为 什 
么 还 要 特地 引入 “只 有 在 作为 函数 形 参 时 ， 数 组 的 声明 才 会 被 解读 


为 指针 ”这 样 奇怪 的 规则 呢 ? 





关于 这 一 点 ，The Development of the C Language 中 有 相关 说 
明 : 


Moreover, some rules designed to ease early 
transitions contributed to later confusion. For example, 
the empty square brackets in the function declaration 


int f(a) int a[]; { ... } 


are a living fossil, a remnant of NB's way of 
declaring a pointer; 


中 文 意思 大 致 如 下 O 


此 外 ， 为 使 早期 的 移植 更 容易 进行 而 设计 的 某 些 规则 ， 却 在 之 
后 引发 了 混乱 。 例 如 ， 函 数 声明 中 的 空 的 方 括号 就 是 个 活化 石 ， 
是 NB 的 指针 声明 方法 的 后 遗 症 。 


* 这 是 ANS1 0 之 前 的 老式 写法 。 


int f(a) int a[]; { ...} 





3-5-2 ”函数 形 参 的 声明 (C99 版 ) 


由 于 在 5 语言 中 ， 将 数组 传递 给 函数 束 相 当 于 将 指向 该 数组 的 初 
台 元 素 的 指针 传递 给 函数 ， 所 以 函数 的 定义 就 会 变 成 下 面 这 样 。 


void func(int *a) 
也 可 以 写成 void func(int a[])， 不 过 它们 的 意思 是 一 样 的 。 
由 于 此 时 传递 给 水 数 的 只 是 指针 ， 所 以 无 论 数组 长 度 是 多 少 都 没 关 


系 。 这 惑 意味 着 可 以 向 函 数 传递 包含 任意 多 个 元 素 的 数组 。 在 实际 使 用 
中 ， 通 党 会 像 下 面 这 样 同 时 将 长 度 也 传递 给 函数 。 


void func(int *a, int size) 


但 是 ，ANS1 C 无 法 实现 “使 二 维 数 组 的 纵横 双向 的 元 素 个 数 可 
变 ” 的 功能 。 


在 C99 中 ， 作 为 VLA 的 一 环 ， 将 “纵横 可 变 的 多 维 数 组 ”传递 给 
水 数 已 成 为 可 能 。 如 下 所 示 的 原型 声明 (以 及 遂 数 定义 ) 可 以 接收 
sizel X size2 的 二 维 数 组 作为 参数 。 


void func(int size1, int size2, int a[size1][size2]) 


通过 将 sizel 和 size2 作为 参数 进行 传递 ， 并 显 式 地 指定 它们 
各 自 代 表 的 是 数组 的 哪个 维度 的 长 度 ， 我 们 实现 了 让 编译 器 计算 数组 元 
素 的 地 址 的 功能 。 


在 上 面 的 例子 中 ，size1 和 size2 排 在 a 之 前 。 这 是 为 了 将 
sizel 和 size2 作为 a 的 元 素 个 数 使 用 。 如 果 想 先 声明 数组 再 声明 
数组 的 长 度 ， 原 型 声明 就 要 写成 下 面 这 样 。 


void func(int a[*][*], int size1, int size2); 


可 能 有 人 会 想 : “这 么 一 来 不 就 搞 不 清 传 进去 的 长 度 对 应 的 是 哪个 
维度 了 吗 ? ”但 是 ， 其 实 只 有 函数 的 原型 声明 才 可 以 采用 上 面 这 种 与 
法 ， 而 函数 本 身 的 定义 必须 写成 下 面 这 样 ， 所 以 是 不 会 有 问题 的 。 


void func(int a[size1][size2]，int size1，int size2) 


{ 


另外 ， 即 便 是 在 C99 中 ，“ 被 传递 给 数组 的 只 是 指针 ”这 一 事实 
也 并 没有 改变 ， 因 此 以 下 三 种 写法 意思 完全 相同 。 


void func(int size1, int size2, int a[size1][size2]) 


/* 数组 长 度 size1 会 被 忽略 ， 所 以 也 可 以 省 略 不 写 */ 


void func(int size1, int size2, int a[][size2]) 


/* 实际 形态 就 是 指针 ， 所 以 可 以 作为 指针 声明 */ 


void func(int size1, int size2, int (*a)[size2]) 











3-5-3 ”关于 空 的 下 标 运 算 符 [] 


人 
素 个 数 省 略 不 写 。 


以 下 情况 都 会 通过 编译 器 做 出 特别 解释 。 请 不 要 将 这 些 规 则 视 为 
一 般 通用 规则 。 


)1. 函数 形 参 的 声明 
如 3-5-1 节 中 所 述 ， 在 函数 的 形 参 中 ， 只 有 最 外 层 的 数组 会 
被 解读 为 指针 。 即 使 写 上 元 素 个 数 ， 也 会 被 忽略 。 
)2. 能 够 通过 初始 化 列表 确定 数组 长 度 的 情况 


在 以 下 情况 中 ， 编 译 器 能 够 通过 初始 化 列表 确定 所 需 的 元 素 个 
数 ， 因 此 对 于 最 外 层 的 数组 ， 可 以 省 略 其 元 素 个 数 。 





int a[] = {1, 2, 3, 4, 5}; 
char str[] = "abc"; 
double matrix[ ][2] 
char *color name[] 
"red", 
"green", 
"blue", 


时 {{1, 0}, {0, 1}}; 
= 


}; 


char color_name[][6] = { 
"red", 
"green", 
"blue", 


}; 





在 对 数组 的 数组 进行 初始 化 时 ， 乍 看 之 下 会 觉得 ， 只 要 有 了 初 
始 化 列表 ， 即 使 不 是 最 外 层 的 数组 ， 编 译 器 也 能 确定 其 元 素 个 数 。 
但 是 ， 由 于 5 语言 允许 如 下 所 示 的 未 对 齐 的 数组 初始 化 ， 所 以 编 
译 器 还 是 无 法 简单 地 确定 除 最 外 层 数 组 以 外 的 数组 的 元 素 个 数 。 


int a[][3] = { /* int a[3][3] 的 省 略 形式 */ 
{1, 2,，3}, 
{4, 5}, 
{6} 


}; 

char str[][5] = { /* char str[3][5] 的 省 略 形式 */ 
"hoge", 
"hog", 
"ho", 


}; 








虽然 也 可 以 考虑 让 编译 器 为 我 们 选择 一 个 最 大 值 ， 但 遗憾 的 
是 ，C 语言 的 语法 并 没有 这 样 做 。 


顺便 说 一 下 ， 在 对 上 述 未 对 齐 的 数组 进行 初始 化 时 ， 没 有 相应 
的 初始 化 列表 的 元 素 会 被 初始 化 为 0。 
使 用 extern 声明 全 局 变量 的 情况 


全 局 变量 仅 在 多 个 编译 单元 〈. ec 文件 ) 的 某 一 个 中 定义 ， 然 
后 在 其 他 的 代码 文件 中 通过 extern 进行 声明 。 


虽然 定义 时 元 素 个 数 是 必需 的 ， 但 在 extern 时 ， 由 于 实际 
Ws 所 以 最 外 层 的 数组 的 元 素 个 数 是 可 以 省 
晤 昌 ] 。 


正如 我 们 之 前 所 说 的 那样 ， 只 有 在 声明 函数 的 形 参 时 ， 数 组 的 
声明 才 可 以 解读 为 指针 。 


下 面 这 种 在 全 局 变量 的 声明 中 混合 使 用 数组 和 指针 的 程序 是 无 
法 正常 运行 的 。 


在 file 1.c 中 ……- 


int a[166]; 


在 file 2.c 中 ……: 


extern int *a; 


在 这 种 情况 下 ，file_1.c 中 (假设 int 为 4 字 节 ) 的 
sizeof(a) 是 400，file_2.c 中 (假设 指针 为 8 字 节 ) 的 
sizeof(a) 是 8。 即 使 用 链接 器 将 它们 结合 起 来 ， 程 序 也 还 是 不 
能 运行 。 因 为 file_2.c 把 原本 是 int 数组 的 a 的 前 8 个 字 节 
解释 成 了 指针 ， 并 引用 了 它 指向 的 内 容 ， 这 样 的 程序 当然 会 朋 溃 。 
对 于 这 种 情况 ， 我 们 当然 会 期 待 链接 器 给 出 点 警告 什么 的 *， 但 在 
我 的 环境 (Ubuntu Linux) 中 ， 什 么 警告 都 没有 出 现 。 


”实际 上 有 些 链 接 器 应 该 会 报 出 警告 。 





)4. 结构 体 的 柔性 数组 成 员 〈 从 099 开始 支持 ) 


从 C099 开始 ， 对 于 结构 体 的 最 后 一 个 成 员 ， 我 们 可 以 用 空 的 
[] 指定 其 长 度 。 


这 是 在 C99 之 前 就 已 经 可 以 使 用 的 可 变 长 结构 体 的 技巧 ， 只 


是 从 C99 开始 才 正式 写 入 语言 规范 。 关 于 它 的 具体 用 法 ， 我 们 将 
在 第 4 章 进行 说 明 。 


补充 “定义 与 声明 
在 C 语 言 中 ， 用 于 规定 变量 和 函数 的 实体 的 “声明 ”被 称 为 “ 定 





XY” 。 
例如 ， 下 面 这 样 的 全 局 变量 的 声明 就 是 定义 *。 


* int a; 这 样 的 定义 准确 来 说 是 暂 定 的 定义 (tentative definition) ， 像 int 
a = 68; 这 样 加 上 初始 化 值 之 后 ， 它 才 会 成 为 “外 部 定义 ”。 


int a; 


如 下 所 示 的 extern 声 明 表 示 的 是 “使 在 某 处 定义 的 内 容 在 此 处 
也 可 用 ”， 因 此 它 并 不 是 定义 。 


extern int a; 


同 理 ， 哨 数 的 原型 是 声明 ， 而 消 数 的 定义 指 的 则 是 实际 写 有 该 函 
数 的 实现 代码 的 那 部 分 内 容 。 

对 于 自动 变量 ， 区 分 定义 与 声明 是 没有 意义 的 。 因 为 自动 变量 的 
声明 必定 伴随 厦 定 义 。 





3-5-4 ”字符 串 字 面 量 
用 “"" 引起 来 的 字符 串 称 为 字符 串 字 面 量 (string literal) 。 


字符 串 字 面 量 的 类 型 是 “char 的 数组 ”。 因 此 ， 在 表达 式 中 ， 它 
会 被 解读 为 指向 char 的 指针 。 


char *str; 


str = "abc"; <-- 将 指向 "abc" 初 始 元 素 的 指针 赋值 给 str 





但 是 ， 对 char 的 数组 进行 初始 化 时 的 情况 是 一 个 例外 。 此 时 ， 编 
译 器 会 将 子 符 串 字面 量 特别 解释 为 伦 括 号 内 字符 分 段 书写 的 初始 化 列表 


的 省 略 形式 。 


char str[] = "abc"; 





具有 相同 含义 。 


由 于 5 语言 原本 是 只 能 处 理 标 量 的 语言 ， 所 以 以 前 是 不 能 对 自动 
变量 的 数组 进行 初始 化 的 。 因 此 ， 以 前 我 们 不 能 写 下 面 这 样 的 代码 。 


char str[] = "abc"; 
必须 写成 下 面 这 样 才 可 以 。 


static char str[] = "abc"; 


不 过 ， 从 ANS1 5 开始 ， 即 使 是 自动 变量 的 数组 ， 也 可 以 一 并 进行 
初始 化 。 


正 因为 如 此 ， 我 们 才能 够 使 用 下 面 这 样 的 写法 。 


char str[] = "abc"; 


不 过 ， 这 仅 限于 用 作 初 始 化 列表 的 情况 ， 所 以 下 面 这 种 写法 是 不 可 


沁 
II 
CT 


char str[4]; 


str = "abc"; 
以 下 内 容 可 能 会 让 人 党 得 有 些 混乱 ， 我 们 来 看 一 下 : 在 下 面 的 例子 


， 由 于 被 初始 化 的 并 不 是 char 的 数组 ， 而 是 指针 ， 所 以 这 并 不 属于 
上 述 的 例外 情况 。 


本 


char *str = "abc"; 


在 这 种 情况 下 ，"abc" 是 “char 的 数组 ”， 由 于 它 在 表达 式 中 ， 
所 以 会 被 解读 为 指向 char 的 指针 ， 然 后 被 赋值 给 str。 


不 管 是 多 么 复杂 的 情况 ， 只 要 按 顺 序 认 真 分 析 标 识 符 的 声明 与 初始 
化 列表 的 花 括号 的 对 应 关系 ， 应 该 都 能 够 解释 清楚 。 


在 下 面 这 种 情况 下 ， 标 识 符 color_name 的 类 型 是 “指向 char 
的 指针 的 数组 ”， 作 为 类 型 分 类 的 数组 对 应 的 是 初始 化 列表 中 最 外 层 的 
花 括号 。 因 此 ，"red"、"blue” 对 应 的 就 是 指向 char 的 指针 。 


char *color name[] = { 


"red", 
"green", 
"blue", 


}; 





在 下 面 这 个 例子 中 ，color_name 的 类 型 变 成 了 “char 的 数组 
(元 素 个 数 为 6) 的 数组 ”。 


char color name[][6] = { 
"red", 
"green", 
"blue", 


}; 





同样 地 ， 由 于 作为 类 型 分 类 的 数组 对 应 的 是 初始 化 列表 中 最 外 层 的 
花 插 号 ， 所 以 "red"、"blue” 对 应 的 是 “char 的 数组 (元 素 个 数 为 
6) ”。 于 是 ， 这 个 声明 与 下 面 的 写法 是 同一 个 意思 。 


char color name[][6] = { 
'e'，, 和 '\0'}, 


{'r', 
{'g', Eg Ye 'e', n', '\0'}, 
{'b', 站 2 ， 2 '\0'}, 


}; 





字符 串 字 面 量 保存 在 只 读 区 域 中 。 但 是 ， 在 被 用 于 初始 化 char 的 
数组 时 ， 它 就 只 是 花 括号 内 字符 分 段 书 写 的 初始 化 列表 的 省 略 形 式 ， 所 
以 只 要 数组 本 身 没 有 被 指定 为 const， 那 么 该 数组 就 是 可 写 的 。 


char str[] = "abc"; 


str[6] = 'd'; <-- 可 写 


但 如 果 写 成 下 面 这 样 ， 操 作 系统 就 会 报错 。 


char *str = "abc"”; 


str[6] = 'd'; <-- 在 大 多 数 运行 环境 中 ， 运 行 时 操作 系统 会 报错 





补充 “字符 串 字 面 量 是 char 的 数组 
字符 串 字 面 量 的 类 型 是 “char 的 数组 ”。 


但 是 ， 由 于 在 表达 式 中 数组 会 被 解读 为 指针 ， 所 以 它 会 被 当 作 指 
问 char 的 指针 处 理 。 


有 没有 读者 认为 字符 串 字 面 量 从 一 开始 就 是 指向 char 的 指针 
呢 ? 


下 面 的 代码 可 以 用 来 确认 “字符 串 字面 量 原本 是 数组 ”这 一 事 


printf("size..%d\n", (int)sizeof("abcdefghijklmnopqrstuvwxyz")); 





3-5-5 ”关于 指 品 范 数 的 指针 引发 的 混乱 


正如 2-3-2 市 中 所 说 ， 在 5 语言 中 ， 上 函 数 在 表达 式 中 会 被 解读 为 
指 疝 函数 的 指针 。 


言 号 处 理 、event-driven 程序 的 回调 函数 经 常 利用 这 种 特性 。 


/* 设置 为 在 发 生 SIGSEGV(Segmentation fault) 时 回调 函数 segv_handler */ 





signal(SIGSEGV, segv_handler); 





但 是 ， 如 果 基于 此 前 讲述 的 规则 解读 C 语言 声明 ， 比 如 在 int 
func(); 这 个 声明 中 ，func 是 “返回 int 的 函数 ”， 而 只 提取 出 


func 并 将 它 解 读 为 “指向 返回 int 的 函数 的 指针 ”的 做 法 就 显得 很 
奇怪 。 如 果 需 要 使 用 指向 函数 的 指针 ， 那 惑 应 该 加 上 &， 把 它 写 成 


此 处 ， 即 使 将 上 面 的 信号 处 理 的 设置 写成 下 面 这 样 。 


signal(SIGSEGV，&segv_handler) 


反 过 来 ， 如 下 所 示 ， 


void (*func p)(); 


func_p(); 


但 由 于 对 于 声明 成 int func(); 的 func， 需 要 采用 func() 的 
方式 进行 调用 ， 所 以 从 对 称 性 上 来 说 ， 声 明成 void (*func_p)(); 
的 func_p 必须 写成 下 面 这 样 ”。 


* 事实 上 ， 以 前 似乎 只 能 采用 这 种 写法 。 





(*func_p)(); 


这 其 实 也 是 能 够 完美 运行 的 。 
的 


造成 这 种 混乱 的 罪魁 祸首 就 是 “函数 在 表达 式 中 会 被 解读 为 指向 函 
数 的 指针 ”这 一 意图 不 明 〈 难 不 成 是 为 了 与 数组 保持 一 致 ? ) 的 规则 。 


为 了 顾全 这 个 问题 ，ANS1 Ce 标准 对 语法 制定 了 以 下 的 例外 规定 。 
。 函数 在 表达 式 中 自动 转换 为 指向 函数 的 指针 ， 但 在 作为 地 址 运算 名 
& 或 者 sizeof 运算 符 的 操作 数 时 例外 。 
。 函数 调用 运算 符 () 的 操作 数 不 是 函数 ， 而 是 指向 函数 的 指针 。 
对 指向 函数 的 指针 使 用 间接 运算 符 * 之 后 ， 指 向 函数 的 指针 会 暂 
但 由 于 是 在 表达 式 中 ， 所 以 它 又 会 立刻 被 转换 为 指向 函数 
指针 。 


结论 就 是 ， 即 使 将 * 运算 符 运用 于 指向 函数 的 指针 ”看 上 去 ) 
它 也 起 不 到 任何 作用 。 


因此 ， 下 面 这 样 的 写法 也 是 能 够 完美 运行 的 。 


(六 六 六 六 六 六 六 六 六 冰 printf) ("hello，world\n"); <-- 反正 * 什 么 也 不 做 


3-5-6 ”强制 类 型 转换 


强制 类 型 转换 符 是 将 某 种 类 型 强制 转换 为 其 他 类 型 的 运算 符 ， 如 下 
所 示 。 


(类 型 名 ) 
关于 强制 类 型 转换 符 ， 有 两 种 截然 不 同 的 用 法 。 
一 种 是 基本 类 型 的 转换 ， 例 如 ， 在 想 要 将 int 类 型 的 变量 当 作 


double 类 型 处 理 时 ， 就 需要 进行 这 种 类 型 转换 。 


int hoge, piyo; 





printf("hoge / piyo..%f\n", (double)hoge / piyo); 


在 C 语言 中 ， 由 于 :int 之 间 进 行 除法 运算 后 结果 也 会 是 int”， 
所 以 如 果 想 要 获取 小 数 部 分 的 数据 ， 就 需要 像 上 面 这 样 ， 将 其 中 的 某 一 
方 (或 者 两 方 ) 转换 为 double。 


”这 可 是 一 个 很 大 的 陷阱 。 


这 种 情况 下 的 强制 类 型 转换 将 int 类 型 的 值 实际 转换 成 了 
double 类 型 。 也 就 是 说 ， 值 的 内 部 表现 发 生 了 变化 ， 编 译 器 会 在 这 计 
分 生成 相当 于 强制 类 型 转换 的 机 器 码 。 


强制 类 型 转换 符 的 另 一 种 用 法 是 指针 的 转换 。 


在 C6 语言 中 ， 指 针 类 型 会 因 其 指向 的 对 象 类 型 的 不 同 而 被 当 作 不 
同 的 类 型 进行 处 理 ， 但 对 这 些 信息 的 掌握 只 到 编译 器 为 止 。 因 为 在 运行 
时 ， 在 大 多 数 机 器 中 ， 指 针 只 是 单纯 的 内 存 地 址 ， 不 论 是 指向 int 的 
指针 ， 还 是 指向 double 的 指针 ， 从 机 器 语言 的 层面 来 看 ， 往 往 都 是 
一 样 的 。 对 指针 进行 强制 的 读 取 蔡 换 就 是 指针 的 强制 类 型 转换 。 


例如 ， 在 char 类 型 的 数组 buf 中 以 二 进 制 形 式 保存 了 数据 ， 那 
么 当 想 要 取出 位 于 offset 位 置 的 int 类 型 数据 时 ， 就 可 以 采用 以 下 
号 法 
char buf[1666] ; 


int offset ; 
int int value 





int value = *(int*)(buf + offset) 


在 本 例 中 ， 通 过 将 buf 加 offset 后 得 到 的 地 址 强制 转换 为 
int* 类 型 ， 并 对 它 使 用 间接 运算 符 ， 可 以 获取 int 类 型 的 值 。 这 里 
的 强制 类 型 转换 对 编译 器 而 言 只 是 改变 了 类 型 信息 ， 通 常 在 运行 时 也 不 
会 有 任何 对 应 ， 所 以 也 不 存在 相应 的 机 器 码 。 


如 果 想 要 瑟 出 可 移植 性 高 的 程序 ， 就 应 该 避免 对 指针 进行 强制 类 型 
转换 。 就 上 例 来 说 也 是 如 此 ， 要 想 正确 使 用 存放 在 buf 中 的 数据 ， 就 
必须 确保 移植 前 后 系统 中 int 类 型 的 长 度 以 及 字 节 序 是 相同 的 "。 就 算 
a 也 应 该 将 相应 的 代码 整合 成 特定 
yJ 候 对 。 


”如 果 这 个 数据 不 需要 从 外 部 读 取 进 来 ， 而 只 在 同一 个 程序 内 部 使 用 ， 应 该 没什么 问 


题 ， 但 如 果 这 样 ， 那 么 一 开始 就 应 该 把 数据 保存 在 结构 体 里 。 





另外 ， 比 如 在 通用 的 GUI 库 中 ， 往 往 会 需要 将 任意 数据 分 配给 在 
画面 上 显示 的 按钮 等 显示 元 素 〈 比 如 在 “计算 器 ”程序 中 ， 数 字 按 钮 中 
需要 记录 相应 数字 的 情况 等 ) 。 在 这 种 情况 下 ， 可 以 先 将 这 些 元 素 记录 
为 void*， 然 后 再 通过 指针 的 强制 类 型 转换 ， 将 它们 转换 成 原来 的 类 
型 。 现 实 中 关于 指针 的 强制 类 型 转换 的 应 用 场景 ， 大 致 也 就 是 这 种 程度 
吧 。 


“不 知 怎么 地 ， 编 译 器 就 报 出 警告 了 ， 那 就 做 一 下 强制 类 型 转换 
吧 ! ”一 “警告 没 了 ， 太 好 了 呼 ! ”一 一 这 种 情况 是 我 们 一 定 要 避免 的 


* 
o 


”可 悲 的 是 ， 这 种 情况 经 常 发 生 。 





编译 器 给 出 警告 总 是 有 它 的 理由 的 ， 所 以 我 们 不 能 就 这 样 通 过 强制 
类 型 转换 让 它 “ 闭 嘴 ”。 要 是 这 么 做 ， 就 算 通 过 了 编译 ， 程 序 也 未 必 能 
够 运行 ， 或 者 虽然 在 当前 的 运行 环境 中 能 够 运行 ， 但 一 换 到 别 的 运行 环 
境 就 跑 不 起 来 了 。 


要 扣 


不 要 用 强制 类 型 转换 掩饰 编译 器 报 出 的 警告 。 





3-5-7 练习 一 一 解读 复杂 声明 
我 们 先 来 练 练 手 。 


C 语言 的 标准 库 中 有 一 个 叫 作 atexit() 的 函数 。 通 过 该 函数 ， 
可 以 在 程序 正常 结束 时 调用 事先 注册 过 的 函数 。 


atexit() 的 原型 定义 如 下 。 
int atexit(void (*func)(void)); 
)1. 先 看 标识 符 。 


int atexit(void (*func)(void)); 





英语 表达 : 


atexit is 


)2. 解析 代表 函数 的 ()。 


int atexit(void (*func)(void)); 
一 -二 \ NA 
英语 表达 : 


atexit is function( ) returning 


)3. 由 于 函数 的 参数 部 分 比较 复杂 ， 所 以 我 们 先 解 析 这 
这 里 也 是 先 看 标识 符 。 


了 此 
过 
遇 


int atexit(void (*func)(void)); 


英语 表达 : 


atexit is function(func is) returning 


)4. 因为 有 括号 ， 所 以 先 解 析 *。 
int atexit(void (*func)(void)); 


英语 表达 : 


atexit is function(func is pointer to) returning 


)5. 解析 代表 函数 的 ( )。 这 里 的 参数 比较 简单 ， 是 void( 无 参 
数 )。 


int atexit(void (*func)(void)); 


英语 表达 : 


atexit is function(func is pointer to function(void) returning) 
returning 


)6. 解析 类 型 修饰 符 void。 至 此 ，atexit 的 参数 部 分 解析 完 


长 


int atexit(void (*func)(void)); 


英语 表达 : 


atexit is function(func is pointer to function(void) returning void) 
returning 


)7. 解析 类 型 修饰 符 int。 
int atexit(void (*func)(void)); 


英语 表达 : 


atexit is function(func is pointer to function(void) returning void) 
returning int 


)8。 翻译 成 中 文 …… 





atexit 是 返回 int 的 函数 (参数 为 指向 返回 void 的 不 带 参 函 数 的 指针 ) 。 








接 下 来 ， 我 们 来 看 一 个 更 加 复杂 的 例子 。 
标准 库 中 还 有 一 个 叫 作 signal() 的 函数 ， 它 的 原型 声明 如 下 所 


ed 
引 | 
Le] 


void (*signal(int sig, void (*func)(int)))(int); 


)1. 先 看 标识 符 。 


void (*signal(int sig, void (*func)(int)))(int); 
英语 表达 : 


signal is 


)2. 由 于 〈) 的 优先 级 比 * 高 ， 所 以 先 解析 () 的 部 分 。 
void (*signal(int sig，void (*func)(int)))(int); 


英语 表达 : 


signal is function() returning 


)3， 解析 参数 部 分 。 参 数 有 两 个 ， 第 一 个 参数 为 int sig。 


void (*signal(int sig, void (*func)(int)))(int); 


英语 表达 : 


signal is function(sig is int,) returning 


下 


现在 来 看 另 一 个 参数 的 标识 符 func。 


void (*signal(int sig, void (*func)(int)))(int); 
英语 表达 : 


signal is function(sig is int, func is) returning 


可 


因为 有 括号 ， 所 以 先 解析 *。 


void (*signal(int sig, void (*func)(int)))(int); 
英语 表达 : 
signal is function(sig is int, func is pointer to) returning 


)6. 解析 代表 函数 的 〈()。 参 数 为 int。 


void (*signal(int sig, void (*func)(int)))(int); 
英语 表达 : 


signal is function(sig is int, func is pointer to function(int) 
returning) returning 


)7. 解析 类 型 修饰 符 void。 
void (*signal(int sig, void (*func)(int)))(int); 
英语 表达 : 


signal is function(sig is int, func is pointer to function(int) 





returning void) returning 


)8. 参数 部 分 解析 完毕 。 接 下 来 ， 因 为 有 括号 ， 所 以 先 解 析 *。 
void (*signal(int sig, void (*func)(int)))(int); 
英语 表达 : 


signal is function(sig is int, func is pointer to function(int) 


returning void) returning pointer to 





)9. 解析 代表 范 数 的 〈) 。 人 参数 为 int。 
void (*signal(int si void (*func)(int 


英语 表达 : 


signal is function(sig is int, func is pointer to function(int) 


returning void) returning pointer to function(int) returning 





最 后 加 上 void。 
void (*signal(int si void (*func)(int int); 


英语 表达 : 


signal is function(sig is int, func is pointer to function(int) 


returning void) returning pointer to function(int) returning void 


翻译 成 中 文 。 














signal 是 返回 “指向 返回 void 的 参数 为 int 的 函数 的 指针 ”的 函数 ， 它 有 两 个 参数 ， 
只 要 能 够 解读 这 种 程度 的 声明 ， 其 他 的 就 都 不 在 话 下 了 。 
个 过 ， 也 有 可 能 是 就 此 彻 后 厌恶 5 语言 。 


另外 ，signal() 郧 数 原 本 是 用 于 注册 信号 处 理 程 序 〈 发 生 中 
断 时 被 调用 的 函数 ) 的 函数 ， 它 的 返回 值 是 此 前 注册 过 的 〈 旧 的 ) 
信号 处 理 程序 。 


也 就 是 说 ， 其 中 一 个 参数 的 类 型 和 返回 值 的 类 型 是 相同 的 ， 都 
是 指向 信号 处 理 程序 的 指针 。 这 难道 不 会 造成 声明 中 出 现 两 次 相同 
模式 的 情况 吗 ? 有 这 个 想法 很 正常 ， 不 过 在 5 语言 中 ， 并 不 会 发 
生 这 种 情况 。 这 是 因为 ， 从 结构 上 来 说 ，C 语言 的 声明 是 “ 忽 左 忽 
人 ， 因 而 表示 返回 值 类 型 的 部 分 通常 分 散在 声明 语句 的 左右 两 
则 。 


在 这 种 情况 下 ， 像 下 面 这 样 使 用 typedef 的 写法 ， 可 以 使 声 
明 变 得 非常 简洁 。 





/* 摘录 自 Linux 的 man page */ 
typedef void(*sighandler t)(int); 


sighandler t signal(int sig, sighandler t func); 





sighandler_t 表示 指向 信号 处 理 程 序 的 指针 这 一 类 型 。 





3-6 ”请 记 住 : 数组 与 指针 截然 不 同 


3-6-1 你 为 什么 感到 混乱 

在 此 ， 请 允许 我 强调 一 下 本 章 的 重要 观点 : 

在 C6 语言 中 ， 数 组 与 指针 是 截然 不 同 的 。 

人 们 常 说 6 语言 中 的 指针 难以 理解 ， 但 其 实 罪魁 祸首 并 非 指 针 本 
身 ，“ 将 数组 与 指针 混为一谈 ” 才 是 让 初学 者 感到 混乱 的 原因 所 在 。 雪 
全。 许多 入 门 书 等 对 数组 与 指针 的 讲解 中 也 充斥 着 大 量 令 人 感 
到 混乱 的 内 容 。 


例如 ，K&R 中 就 有 以 下 内 容 〈 见 该 书 5.3 节 ) 。 


在 5 语言 中 ， 指 针 与 数组 之 间 的 关系 十 分 紧密 ， 因 此 ， 在 接 下 


来 的 部 分 中 ， 我 们 将 同时 讨论 指针 与 数组 。 





令 人 意外 的 是 ， 许 多 程序 员 认 为 数组 与 指针 几乎 是 相同 的 ， 这 一 认 
识 是 让 很 多 人 对 6 语言 感到 混乱 的 主要 原因 。 


数组 与 指针 是 截然 不 同 的 。 从 图 3-17 中 可 以 一 目 了 然 地 看 出 ， 数 
组 是 由 一 些 对 象 排列 而 成 的 ， 而 指针 表示 指向 茶 处 。 


数组 


图 3-17 数组 与 指针 

事实 上 ， 在 运用 sizeof 运算 符 之 后 ， 如 果 操作 数 是 数组 ， 则 返 
回 值 是 “元 素 长 度 X 数 组 的 元 素 个 数 ”; 如 果 操 作 数 是 指针 ， 则 返回 值 
是 指针 的 长 度 。 

可 是 ， 初 学 者 常会 基于 “数组 与 指针 几乎 是 相同 的 ”这 一 错误 理 
解 ， 写 出 下 面 这 样 的 代码 。 


int *p; 





p[3] = 16; <-- 突然 使 用 没有 指向 任何 内 存 空间 的 指针 
一 一 当 自 动 变量 的 指针 处 于 初期 状态 时 ， 值 是 不 确定 的 。 


char str[16] ; 


str = "abc";j 《<-- 突然 赋值 给 数组 


` 是 结构 体 ， 因 此 这 样 的 写法 并 不 能 把 abc 








当 作 一 个 可 体 凡 给 才 组 。 





int p[]; <-- 在 局 部 变量 的 声明 中 使 用 空 的 下 标 运算 符 [] 





只 有 在 声明 函数 形 参 时 ， 数 组 的 声明 才 会 被 解读 为 指针 。 


数组 与 指针 到 搬 在 哪些 方面 是 相似 的 ， 在 哪些 方面 是 不 同 的 呢 ? 下 
面 我 们 再 次 说 明 一 下 ， 其 中 可 能 会 出 现 与 前 面 重复 的 内 容 。 


3-6-2 ”在 表达 式 中 


在 表达 式 中 ， 数 组 会 被 解读 为 指向 该 数组 初始 元 素 的 指针 ， 因 此 代 
码 可 以 写成 下 面 这 样 。 


int *p; 


int array[16]; 
p = array; 《<-- 将 指向 array[8] 的 指针 赋 给 p 





但 是 ， 反 过 来 瑟 成 下 面 这 样 就 不 行 。 





在 表达 式 中 ，array 的 确 是 被 解读 成 了 指针 ， 但 它 其 实 是 被 解读 
成 了 &array[6]， 因 为 此 时 的 指针 是 一 个 右 值 ”。 


”关于 这 一 点 ， 标 准 中 也 有 关于 数组 不 是 可 修改 的 左 值 (modifiable lvalue) 的 说 


明 。 无 论 如 何 ， 不 能 赋值 的 结论 是 不 变 的 。 





假设 有 int 类 型 的 变量 a， 可 以 对 它 进行 a = 16; 这 样 的 赋 
值 。 但 是 ， 应 该 没 人 想 要 进行 a + 1= 16; 这 样 的 赋值 吧 ? 不 论 是 a 
还 是 a + 1， 它 们 的 类 型 都 是 int。 而 a + 1 是 不 具有 相应 存储 空间 
的 右 值 ， 所 以 我 们 无 法 对 它 进行 赋值 。array 不 能 被 赋值 也 是 同样 的 
道理 。 


另外 ， 当 有 如 下 指针 时 ， 





int *p; 


如 果 p 指向 了 某 个 数组 ， 那 么 通过 p[i] 的 方式 访问 数组 是 可 行 
的 ， 但 这 并 不 意味 着 p 就 是 数组 。 


因为 p[i] 只 是 *(p + i) 的 语法 糖 ， 所 以 只 要 指针 p 正确 地 指 


向 了 数组 ， 我 们 就 可 以 通过 p[i] 的 方式 访问 数组 的 内 容 。 假 如 用 图 表 
示 ， 则 如 图 3-18 所 示 。 


1] 





数组 


图 3-18 ”使 用 指针 访问 数组 


其 他 比较 容易 使 初学 者 感到 混乱 的 还 有 “指针 的 数组 ”和 “数组 的 
数组 ” 〈 二 维 数 组 ) 。 


char *color_name[] = { <-- 指针 的 数组 
"red", 
"green", 
"blue", 





}; 


上 述 代码 如 图 3-19 所 示 。 





图 3-19 指针 的 数组 


char color_name[][6] = { <-- 数组 的 数组 


"red", 


"green", 
"blue", 





}; 


上 述 代码 则 如 图 3-20 所 示 。 





图 3-20 ”数组 的 数组 
哩 然 这 两 段 代 码 中 的 任何 一 段 都 可 以 通过 color_name[i][j] 的 


方式 访问 数组 ， 但 请 注意 ， 它 们 在 内 存 上 的 布局 是 全 然 不 同 的 。 
3-6-3 ”在 声明 中 

只 有 在 声明 函数 形 参 时 ， 才 可 以 将 数组 的 声明 解读 成 指针 的 声明 
(3-5—1 节 ) o 

很 多 人 都 觉得 ， 与 其 说 “只 有 在 声明 函数 形 参 时 才能 将 数组 的 声明 
解读 成 指针 的 声明 ”这 一 语法 糖 提 高 了 5 语言 的 可 读 性 ， 不 如 说 它 反 


而 助长 了 5 语言 中 的 混乱 之 势 。 顺 便 说 一 下 ， 我 也 是 这 么 认为 的 "。 而 
K&R 中 杂乱 的 说 明 又 推波助澜 般 地 加 重 了 这 一 混乱 的 局 面 。 


”当然 我 同时 也 觉得 在 传递 多 维 数组 时 ， 使 用 这 个 语法 糖 的 代码 更 容易 理解 。 





除了 声明 函数 形 参 以 外 ， 将 数组 的 声明 等 同 于 指针 的 声明 的 情况 是 
不 存在 的 。 


最 容易 招致 混乱 的 就 是 在 使 用 extern 时 〈3-5-3 节 ) 。 男 外 ， 
如 果 将 局 部 变量 或 结构 体 成 员 写 成 下 面 这 样 ， 就 会 引发 语法 错误 。 


* C99 的 柔性 数组 成 员 (3-5-3 节 ) 除外 。 





即使 存在 初始 化 列表 ， 也 可 以 在 声明 数组 时 使 用 空 的 []， 但 这 只 
是 单纯 地 由 于 在 这 种 情况 下 编译 器 可 以 数 出 元 素 个 数 ， 所 以 才能 将 元 素 
个 数 省 略 ， 这 与 指针 没有 任何 关系 。 








【非常 重要 ! 】 


数组 与 指针 是 截然 不 同 的 。 





‖ 第 4 章 


数组 和 指针 的 常见 用 法 


4-1 ”基本 用 法 | 


4-1-1 ”通过 返回 值 以 外 的 方法 返回 


关于 通过 返回 值 以 外 的 方法 返回 值 ， 我 们 在 1-3-7 贡 已 经 说 明 过 
了 ， 这 里 总 结 一 下 。 


在 5 语言 中 ， 可 以 使 用 返回 值 让 函数 返回 值 ， 但 是 这 种 方法 只 能 
返回 一 个 值 。 


在 没有 异常 处 理 机 制 的 5 语言 中 ， 蚊 数 的 返回 值 多 半 用 于 返回 处 
理 状态 《成功 或 失败 ， 如 果 失 败 ， 还 需要 返回 失败 的 原因 ) 。 


此 处 ， 如 果 将 指针 作为 参数 传递 给 函数 ， 并 在 被 调用 方 对 该 指针 指 
向 的 对 象 进行 填充 ， 就 可 以 一 次 性 地 从 函数 返回 多 个 值 。 


在 这 种 情况 下 ， 假 设 需要 返回 的 数据 的 类 型 为 T， 则 参数 类 型 
为 “指向 T 的 指针 ”。 


如 代码 清单 4-1 所 示 ， 可 以 将 int 和 double 的 指针 分 别传 递 
给 func()， 然 后 向 它们 指向 的 内 容 填 充值 。 


代码 清单 4-1 output argument.c 


1 #include <stdio.h> 

2 

3 void func(int *a, double *b) 
4 

5 *a = 5; 

6 *b = 3.5; 

7 } 

8 

9 int main(void) 
16 { 
11 int a; 
12 double b; 
13 
14 func(&a, &b); 
15 printf("a..%d b..%f\n", a, b); 
16 
17 return ©; 


如 果 硕 望 通过 返回 值 以 外 的 方法 从 函数 返回 类 型 T 的 值 ， 可 以 
通过 向 函数 传递 “指向 T 的 指针 ”类 型 的 参数 来 实现 。 





4-1-2 将 数组 作为 函数 的 参数 传递 


天 于 将 数组 作为 函数 的 参数 传递 ，1-4-6 市 也 讲解 过 ， 这 里 我 们 总 
结 一 下 。 


在 5 语言 中 其 实 是 不 可 以 将 数组 作为 参数 传递 的 ， 但 是 通过 传递 
指向 数组 初始 元 素 的 指针 ， 可 以 达到 与 传递 数组 相同 的 效果 。 


然后 ， 函 数 就 可 以 像 下 面 这 样 引 用 数组 的 内 容 。 


因为 array[i] 说 到 底 只 不 过 是 *(array + i) 的 语法 糖 而 已 。 


如 代码 清单 4-2 所 示 ， 可 以 将 数组 array 传递 给 func()， 
在 func() 中 输出 数组 的 内 容 。 


func() 还 通过 参数 size 接收 了 数组 array 的 元 素 个 数 。 这 是 
因为 ， 对 func() 来 说 ，array 只 是 单纯 的 指针 ， 所 以 func() 无 法 
知晓 调用 方 的 数组 的 元 素 个 数 。 


main() 中 array 的 类 型 是 “int 的 数组 ”， 因 此 也 可 以 像 第 16 
行 那 样 ， 通 过 sizeof 运算 符 获 取 数 组 的 长 度 。 


然而 ， 在 func() 中 ， 由 于 参数 array 的 类 型 是 “指向 int 的 
a ， 所 以 就 算 写 了 sizeof(array)， 能 够 获取 的 也 只 是 指针 的 长 


， 台 末 数 组 6 E 够 像 字符 串 那样 末尾 必定 有 “\8'， 那 么 被 调用 
方 就 可 以 过 检索 '\8' 确定 字符 串 的 字符 个 数 。 


代码 清单 4-2 pass array.c 


#include <stdio.h> 
void func(int *array, int size) 
{ 
int i; 
for (i = 6;j i < size; i++) { 
printf("array[%d]..%d\n", i, array[i]); 
} 
} 
int main(void) 
int array[] = {1, 2, 3, 4, 5}; 


func(array, sizeof(array) / sizeof(array[6])); 


return ©; 





要 点 
如 果 想 将 类 型 T 的 数组 作为 参数 传递 ， 那 么 传递 “指向 T 的 


指针 ”就 可 以 了 。 但 是 ， 由 于 被 调用 方 不 知道 数组 的 元 素 个 数 ， 所 
以 有 时 需要 通过 别 的 途径 将 数组 元 素 个 数 传递 过 去 。 





4-1-3 ”动态 数组 一 一 通过 malloc () 分 配 的 可 变 长 数组 


在 5 语言 中 ， 一 般 来 说 ， 在 编译 时 必须 知道 数组 的 元 素 个 数 。 虽 
然 C99 中 引入 了 可 变 长 数组 ， 但 由 于 它 只 能 用 于 自动 变量 ， 所 以 在 函 
数 执行 结束 时 ， 内 存 就 会 被 释放 掉 。 而 实际 需要 使 用 可 变 长 数组 的 情况 
多 数 是 像 “ 保 存 通过 编辑 器 输入 的 一 行文 本 ”这 样 布 望 在 函数 结束 后 继 
续 持 有 数据 的 情况 。 


在 这 种 情况 下 ， 通 过 malloc() 就 可 以 在 运行 时 仅 分 配 所 需 大 小 
的 数组 ， 并 持续 持 有 该 数组 。 


在 本 书 中 ， 我 们 将 这 样 的 数组 称 为 动态 数组 。 


”这 并 不 是 5 语言 标准 规定 的 术语 ， 不 过 大 家 经 常 这 么 称呼 它 。 另 外 ， 本 书 第 1 版 


称 之 为 “可 变 长 数组 ”， 但 现在 如 果 还 使 用 可 变 长 数组 的 说 法 ， 就 容易 与 C99 中 的 VLA 混 
清 。 





如 代码 清单 4-3 所 示 ， 首 先 让 用 户 输入 数组 长 度 (第 11 行 第 
13 行 ) ， 然 后 在 第 15 行 中 使 用 malloc() 以 该 长 度 分 配 数 组 这 里 
省 略 了 对 返回 值 的 检查 ) 。 


第 17 行 第 19 行 用 于 设置 该 数组 的 值 ， 第 20 行 第 22 行 用 于 
输出 该 数组 的 内 容 。 


代码 清单 4-3 variable array. c 


1 #include <stdio.h> 
2 #include <stdlib.h> 


int main(void) 
{ 
char buf[256]; 
int size; 
int *Variable_array 
int 于 


printf("Input array size>"); 
fgets(buf, 256, stdin); 
sscanf(buf, "%d", &size); 


variable array = malloc(sizeof(int) * size); 


for (i = 6;j i < size; i++) { 
variable array[i] = i; 
} 
for (i = 6;j i < size; i++) { 
printf("variable array[%d]..%d\n", i, variable array[il]); 


} 


return 0©; 





如 果 想 改变 已 分 配 的 动态 数组 的 长 度 ， 可 以 使 用 realloc()。 
在 代码 清单 4-4 中 ， 每 当 用 户 输入 int 类 型 的 值 时 ， 程 序 就 会 使 


用 realloc() 对 variable_array 进行 扩充 〈 这 里 也 省 略 了 对 返回 
值 的 检查 ) 。 


代码 清单 4-4 realloc.c 





1 #include <stdio.h> 
2 #include <stdlib.h> 
3 

4 int main(void) 


int *vyariable array = NULL; 
int size = 0; 

char buf[256]; 

int 1 


while (fgets(buf, 256, stdin) != NULL) { 


Size++; 
variable array = realloc(variable array, sizeof(int) * size); 
sscanf(buf, "%d", &variable array[size-1]); 


} 
for (i = 6;j i < size; i++) { 
printf("variable array[%d]..%d\n", i, variable array[i]); 


} 


return 0©; 





需要 注意 的 是 ， 在 使 用 5 语言 实现 动态 数组 时 ， 程 序 员 必须 自己 
管理 数组 的 元 素 个 数 。 


这 与 通过 参数 传递 数组 时 ， 被 调用 方 无 法 获取 数组 长 度 是 同样 的 道 
理 。 通 过 malloc() 获取 的 只 是 指针 ， 并 非 数组 。 


要 点 


如 果 想 获取 类 型 T 的 可 变 长 数组 ， 可 以 使 用 “指向 T 的 指 
针 ” 通 过 malloc() 动态 分 配 内 存 。 


但 是 ， 此 时 程序 员 需 要 自己 管理 数组 的 元 素 个 数 。 


补充 其 他 语言 的 数组 





虽然 本 书 是 讲 C 语 言 的 ， 但 下 面 这 些 内 容 大 家 也 可 以 参考 一 下 。 

如 今 ， 在 除 C 语 言 以 外 的 大 多 数 语言 (Java、C#、Python、Ruby 
等 ) 中 ， 数 组 是 被 分 配 到 堆 上 ， 然 后 通过 引用 相当 于 C0 语 言 中 的 指 
针 ) 进行 处 理 的 ”。 


* pHP 和 Go 除外 。 





在 用 5 语言 编写 如 下 代码 时 ， 


int hoge[16]; 


大 多 数 的 运行 环境 会 将 数组 本 身分 配 到 栈 上 ， 但 如 果 是 使 用 
Java， 束 个 能 采用 这 样 的 方式 ， 而 要 写成 下 面 这 样 。 


int[] hoge = new int[16]; 


new 就 相当 于 C 语言 中 的 malloc()， 因 此 这 段 代 码 与 C 语言 
的 下 面 这 种 写法 从 意思 上 来 说 是 非常 相像 的 。 


因此 ，Java 总 是 通过 指针 〈Java 中 称 为 “引用 ”) 引用 数组 。 
例如 ， 在 Java 中 ， 像 下 面 这 样 对 数组 进行 赋值 ， 


int[] hoge = new int[16]; 
int[] piyo = hoge; 


则 实现 过 程 会 是 图 4-1 这 样 。 因 为 这 里 的 hoge 和 piyo 是 指 
向 数组 实体 的 指针 变量 。 


Re 数组 


(dD 
-| 


图 4-1 对 Java 的 数组 赋值 


在 这 种 情况 下 ， 如 果 像 hoge[3] = 5; 这 样 通 过 hoge 改变 数 
组 的 内 容 ， 则 piyo[3] 的 值 也 会 变 成 5。 因 为 它们 指向 的 是 相同 的 
数组 。 


但 是 ，Java 等 的 数组 与 用 5 语言 通过 malloc() 分 配 的 数组 


不 同 ， 数 组 的 长 度 是 可 以 通过 询问 数组 本 身 获取 的 。 因 此 ， 如 果 使 用 
Java， 可 以 通过 hoge.length 获取 数组 的 长 度 。 


4-2 组 合 使 用 | 


4-2-1 动态 数组 的 数组 
这 里 考虑 开发 一 个 管理 一 整个 星期 的 “今日 标语 ”的 程序 。 
星期 一 的 标语 是 “日 行 一 善 ”， 星 期 二 的 标语 是 “要 关心 父 
i 是 不 是 充满 了 说 教 意味 ? 


每 星期 的 长 度 为 7 天 ， 这 是 固定 不 变 的 。 但 标语 的 长 度 却 每 天 都 
不 同 。 假 设 中 文 的 一 个 字符 占 UTF-8 的 3 个 字 节 ， 那 么 算 上 结尾 的 
'\0'，“ 日 行 一 善 ” 的 长 度 就 是 13 个 字 节 ， 而 “要 关心 父母 ”就 是 
16 个 字 节 。 在 这 种 情况 下 ， 如 果 为 了 迎合 最 长 的 标语 而 生成 很 长 的 二 
维 数 组 ， 就 会 造成 内 存 的 浪费 。 


而 如 果 为 了 让 用 户 能 够 自由 地 设置 标语 而 采用 从 设置 文件 读 取 标语 
的 形式 "， 那 么 标语 的 最 大 长 度 就 无 法 预测 了 。 


和 





”一 般 是 这 么 做 的 吧 ? 





此 时 ， 由 于 标语 长 度 是 可 变 的 ， 所 以 使 用 char 的 动态 数组 似乎 是 
一 个 不 错 的 选择 。 也 就 是 说 ， 用 “char 的 动态 数组 的 数组 (元 素 个 数 
7) ”来 存放 一 整个 星期 的 标语 就 可 以 了 (图 4-2) 。 


星期 一 | 要 关心 人 母 0 | 父母 \0 
星期 二 
星期 三 
星期 四 
星期 五 


星期 六 


图 4-2 一 整个 星期 的 标语 
该 数组 的 声明 如 下 所 示 。 


char *slogan[7]; 


在 用 C 语言 实现 动态 数组 时 ， 通 常 需要 程序 员 上 自己 对 数组 的 元 素 
个 数 进行 管理 。 但 在 这 种 情况 下 ， 数 组 中 保存 的 是 字符 串 ， 而 字符 串 必 
定 是 以 空 字符 结尾 的 ， 所 以 不 需要 保留 元 素 个 数 ， 因 为 必要 时 随时 可 以 
通过 计算 获取 元 素 个 数 。 


从 文件 等 读 取 一 整 个 星期 的 标语 的 程序 享 如 代码 清单 4-5 所 示 。 与 
前 面 一 样 ， 这 里 也 省 略 了 对 malloc() 返回 值 的 检查 。 


代码 清单 4-5 read slogan.c 





1 #include <stdio.h> 

2 #include <stdlib.h> 

3 #include <string.h> 

4 

5 #define SLOGAN_ MAX_LEN (1624) 














6 
7 void read slogan(FILE *fp, char **slogan) 
81{ 
9 char buf[1624] ; 
16 int slogan_ len; 
11 int i; 
12 
13 for (i = 6; i < 7; i++) { 
14 fgets(buf, SLOGAN MAX LEN, fp); 
15 
16 slogan len = strlen(buf); 
17 if (buf[slogan_ len - 1] != '\n') { 
18 fprintf(stderr,， "标语 过 长 。\n"); 
19 exit(1); 
26 } 
21 /* 删除 换行 字符 */ 
22 buf[slogan len - 1] = '\'; 
23 
24 /* 分 配 用 于 保存 一 条 标语 的 内 存 空间 */ 
25 slogan[i] = malloc(sizeof(char) * slogan_ len); 
26 
27 /* 复制 标语 的 内 容 */ 
28 strcpy(slogan[i], buf); 
29 } 
36 } 
31 
32 int main(void) 
33 { 
34 char *slogan[7]; 
35 int i; 
36 
37 read slogan(stdin, slogan); 
38 
39 /* 显示 读 取 进 来 的 标语 */ 
46 for (i = 68; i 7; i++) { 


41 printf("%s\n", slogan[i]); 


42 } 


44 return ©; 


在 代码 清单 4-5 中 ， 程 序 从 标准 输入 读 取 一 整个 星期 的 标语 ， 然 
后 将 它们 输出 (第 40 行 ` 第 42 行 ) 。 因 为 这 里 通过 参数 向 
read_ slogan() 函数 传递 了 “指向 char 的 指针 的 数组 ”， 所 以 接收 
它 的 参数 的 类 型 就 是 “指向 char 的 指针 的 指针 ” (第 7 行 ) 。 我 们 
pl 如 果 想 通过 参数 传递 类 型 T 的 数组 ， 那 么 传递 “指向 T 的 
旧 针 ” 即 可 。 


本 程序 通过 slogan[i] 获取 的 是 指向 标语 的 开头 的 指针 ， 如 果 想 
要 取出 标语 的 第 n 个 字符 ， 可 以 通过 slogan[i][n] 实现 ”。 


”中 文字 符 如 果 采 用 GBK 编码 ， 则 占 2 个 字 节 ; 如 果 采 用 UTF-8 编码 ， 则 占 3 个 


字 节 ， 因 此 假如 直接 这 样 写 ， 可 能 取 不 出 “第 n 个 字符 ”。 如 果 需 要 按照 实际 的 字符 单位 
处 理 ， 使 用 宽 字符 请 参考 本 节 补 充 内 容 ) 更 好 。 





slogan 不 是 多 维 数 组 (数组 的 数组 ) 。 从 图 4-2 中 就 可 以 明显 
看 出 ， 它 在 内 存 上 的 布局 与 多 维 数组 是 完全 不 同 的 。 


比如 ， 对 于 如 下 所 示 的 多 维 数组 的 声明 ， 


int hoge[16][16]; 


hoge[i] 的 类 型 为 “int 的 数组 (元 素 个 数 10) ”。 因 为 在 表达 
式 中 数组 会 被 解读 为 指针 ， 所 以 hoge[i] 的 类 型 变 为 “指向 int 的 
指针 ”， 因 而 我 们 可 以 通过 hoge[i][j] 引用 相应 的 内 容 。 


对 于 slogan 来 说 ， 由 于 slogan[i] 一 开始 就 是 指针 ， 所 以 当 
然 可 以 写成 slogan[i][j] 这 样 。 


另外 ， 通 过 第 5 行 可 以 看 出 ， 本 程序 中 标语 的 最 大 长 度 限 制 在 
1024 个 字符 。 


或 许 有 人 会 产生 下 面 的 想法 。 


本 以 为 使 用 的 是 “char 的 动态 数组 ”， 所 以 对 标语 的 长 度 就 没 


有 限制 了 。 既 然 要 限制 ， 为 什么 不 用 多 维 数组 呢 ? 





这 里 请 大 家 思考 一 下 。 如 果 同 样 地 对 多 维 数组 添加 “最 大 1024 个 
字符 ”的 限制 ， 那 么 声明 就 会 变 成 下 面 这 样 。 


char slogan[7][1624]; 


这 会 占用 7 X 1024 个 字符 大 小 的 内 存 。 但 在 代码 清单 4-5 中 ， 
在 读 取 1024 个 字符 大 小 的 数组 时 ， 只 需要 一 个 临时 缓冲 区 就 解决 问题 
了 。 而且， 由 于 该 数组 为 自动 变量 ， 所 以 缓冲 区 会 在 程序 离开 
read_slogan() 的 同时 被 释放 。 使 用 这 种 方式 ， 就 算 对 字符 数 有 所 限 
和 
分 实用 的 。 


* 在 某 些 运 行 环 境 中 ， 栈 的 空间 大 小 是 固定 的 ， 而 且 还 非常 小 。 
在 这 样 的 运行 环境 上 ， 如 果 用 自动 变量 分 配 特 别 大 的 数组 ， 就 会 引起 


栈 溢出 。 





当然 ， 有 时 可 能 无 论 如 何 都 不 想 添 加 这 种 限制 “。 在 这 种 情况 下 ， 
可 以 考虑 依旧 用 malloc() 来 分 配 用 于 读 取 的 临时 缓冲 区 ， 当 内 存 空 
间 不 足 时 再 用 realloc() 进行 扩展 。 


* 顺便 说 一 下 ， 在 GNU 的 编码 标准 中 ， 这 种 限制 是 被 禁止 的 。 





了 3 清 
引 清 


件 ， 
一 个 用 于 测试 的 main() 函数 〈 代 码 清单 4-8) 


于 


ONQ]OUWUPUWUDOP 


这 里 通过 这 种 方法 实现 了 一 个 能 够 读 取 任意 长 度 的 行 的 函数 ， 如 代 
青 单 4-6 所 示 。 


read_line() 是 相当 通用 的 函数 ， 因 此 我 们 提供 一 
使 它 在 其 他 程序 中 也 能 使 用 〈 代 码 清单 4-7) 。 另 外 ， 这 里 还 准备 


代码 清单 4-6 read line.c 





#include “stdio.h> 
#include <stdlib.h> 
#include “assert.h> 
#include <string.h> 


#define ALLOC SIZE (256) 


/* 

* 用 于 读 取 行 的 缓冲 区 。 可 根据 需要 进行 扩展 ， 不 会 缩小 
* 通过 调用 free_buffer() 释 放 绥 冲 区 

yA 

static char *st line buffer = NULL; 




















/* 

* 给 st_line_buffer 指 向 的 区 域 分 配 的 内 存 空间 的 大 小 
*/ 

static int st current buffer size = 0; 

/* 

* st_line_buffer 中 当前 保存 的 字符 的 大 小 

*/ 


static int st current used size = 0@; 


/* 
* 向 st_line_buffer 的 末尾 添加 1 个 字符 
* 可 根据 需要 对 st_line_buffer 指 向 的 内 存 空间 进行 扩展 
*/ 

static void 

add character(int ch) 


{ 











/* 
* 由 于 st_current_used_size 一 定 是 每 次 增加 1 字 节 
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* 














* 所 以 应 该 不 会 出 现 因 以 下 断言 而 突然 跳出 本 函数 的 情况 
机 


assert(st current buffer size >= st current used size) 





7 
* 当 st_current used size 等 于 st_current buffer size 时 
* 对 缓冲 区 进行 扩展 
*/ 
if (st current buffer size == st current used size) { 
st line buffer = realloc(st line _buffer， 
(st _current buffer size + ALLOC SIZE) 
* sizeof(char)); 
st _current buffer size += ALLOC SIZE; 


} 

/* 在 缓冲 区 末尾 添加 1 个 字符 */ 

st line buffer[st current used _ size] = ch; 
st _current used sizett+; 





* 从 fp 读 取 1 行 。 当 执行 到 达 文 件 末尾 时 ， 返 回 NULL 


*/ 








char *read line(FILE *fp) 


{ 


int ch; 
char *ret; 


st _current used size = 0@; 
while ((ch = getc(fp)) != EOF) { 
if (ch == '\n') { 
add character('\'); 
break; 


} 
add character(ch); 


if (ch == EOF) { 
if (st current used size > 06) { 
/* 最 后 一 行 的 后 面 没有 换行 的 情况 */ 
add_ character('\'); 
} else { 
return NULL; 

















} 
} 


ret = malloc(sizeof(char) * st current used size); 
strcpy(ret, st line buffer); 


return ret; 
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* 释放 缓冲 区 。 虽 然 不 调用 本 函数 其 实 也 没什么 区 别 

* 但 如 果 你 想 要 在 程序 结束 时 把 通过 malloc() 分 配 的 内 存 空间 全 部 free( ) 掉 
* 那么 在 最 后 调用 本 函数 即 可 

4 


void free buffer(void) 







































































free(st line buffer); 
st line buffer = NULL; 
st _current buffer size 


= 0; 
st _current used size = 0@; 


代码 清单 4-7 read line.h 


#ifndef READ LINE H INCLUDED 
#define READ LINE H INCLUDED 


#include <stdio.h> 


char *read line(FILE *fp); 
void free buffer(void); 


#endif /* READ LINE H_ INCLUDED */ 


代码 清单 4-8 main.c 





#include <stdio.h> 
#include "read line.h" 


int main(void) 


{ 


char *line; 


8 while ((line = read line(stdin)) != NULL) { 


9 printf("%s\n", line); 
16 } 
11 free buffer(); 
12 } 





read_line() 的 返回 值 是 读 取 的 行 〈 删 除了 换行 符 ) 。 如 果 读 到 
了 文件 末尾 ， 则 返回 NULL。 


在 read_line() 中 ， 用 于 临时 读 取 的 缓冲 区 将 被 分 配 到 指针 st_ 
line_buffer” 指 向 的 位 置 。 每 当 缓 冲 区 不 足 时 ， 就 扩展 大 小 为 
ALLOC_SIZE 的 空间 。 之 所 以 采用 这 种 方法 ， 是 为 了 避免 过 于 频繁 地 调 
用 realloc() 而 导致 效率 低下 以 及 碎片 化 ” (2-6-5 节 ) 。 


”对 于 作用 域 在 文件 内 的 static 变量 ， 我 一 般 会 加 上 前 缀 st_。 


”如 果 是 无 法 预测 元 素 个 数 的 通用 集合 库 ， 与 其 像 本 例 这 样 每 次 以 一 定数 量 进行 扩 
展 ， 不 如 以 “当前 大 小 的 固定 倍数 ”进行 扩展 。 假 设 固 定 以 2 倍 进行 扩展 ， 就 可 以 保证 无 
用 的 内 存 空间 在 50% 以 下 ， 而 且 即 便 元 素 个 数 变 多 ， 需 要 调用 realloc() 的 次 数 也 几乎 
不 会 增加 。 实 际 上 ，Java 的 Vector 类 等 就 是 以 2 倍 进行 扩展 的 。 





如 果 读 到 了 行 的 末尾 ， 就 重新 根据 该 行 的 长 度 分 配 内 存 空 间 〈 第 
77 行 ) ， 并 在 将 st_line_buffer 的 内 容 复制 过 去 之 后 返回 。 由 于 下 
一 次 调用 时 还 需要 使 用 缓冲 区 ， 所 以 不 需要 释放 st_line_buffer。 


”该 方法 使 用 了 static 的 变量 ， 因 此 不 能 直接 用 于 多 线程 编程 ， 请 大 家 务必 注意 这 
点 





由 于 st_line_buffer 只 会 一 味 地 增 大 而 不 会 缩小 ， 所 以 它 会 占 
用 大 小 相当 于 之 前 已 经 读 取 的 最 大 长 度 的 行 (+ a ) 的 内 存 空 间 。 不 
过 ， 反 正 就 只 有 这 一 块 内 存 空间 ， 所 以 其 实 放 在 那里 不 管 也 没什么 关 
系 ， 如 果 你 觉得 在 程序 结束 时 ， 最 好 将 通过 malloc() 分 配 的 内 存 空 
间 全 部 free() 掉 ， 那 么 在 最 后 调用 一 下 free_buffer() 就 可 以 


可 六 


read_line() 通过 malloc() 分 配 字符 串 的 内 存 空 间 并 返回 ， 
此 在 使 用 完毕 后 必须 在 调用 方 使 用 free() 释放 掉 内 存 空间 。 


char *str; 
str = read line(fp); 











/* 各 种 处 理 */ 
free(str); <-- 使 用 














另外 ， 代 码 清单 4-6 也 和 前 面 一 样 ， 省 略 了 对 malloc() 和 
realloc() 的 返回 值 的 检查 。 但 对 于 如 此 通用 的 函数 ， 我 们 还 是 应 该 
好 好 地 对 它 进行 返回 值 检 查 的 。 因 此 ， 我 们 会 在 4-2-4 节 给 出 有 返回 
值 检 查 的 版 本 。 


补充 “ 宽 字 符 


在 代码 清单 4-5 中 ， 字 符 串 保存 在 char 的 《可 变 长 ) 数组 
中 。 不 只 是 本 书 ， 不 少 5 语言 的 入 门 书 也 采用 了 这 种 方式 。 


但 是 ， 如 果 将 中 文字 符 串 存放 在 char 中 ， 那 么 “取出 第 n 个 
字符 ”可 不 是 一 件 容易 的 事 。 利 用 slogan[i][j] 这 种 写法 能 够 取 
出 的 只 是 “第 n 个 字 节 ”的 字 节 ， 而 不 是 “第 n 个 字符 ”。 在 编写 
诸如 编辑 器 这 样 的 程序 时 ， 这 一 点 很 让 人 头疼 。 因 为 编辑 器 的 光标 必 
须 以 字符 为 单位 移动 。 


在 这 种 情况 下 ， 可 以 《在 某 种 程度 上 ) 使 用 宽 字 符 (wide 


character) 。 


从 根本 上 来 说 ， 宽 字符 与 表示 1 字 节 的 char 不 同 ， 它 是 表 
示 “1 个 字符 ”的 类 型 ， 在 程序 中 被 记 为 wchar_t 类 型 
(stddef.h) 。 


如 果 像 read_slogan. c 这 样 将 字符 串 保 存在 char 的 数组 中 ， 
那么 以 中 文字 符 为 例 ，GBK 编码 占 2 字 节 ，UTF-8 编码 占 3 字 节 ， 
我 们 将 这 样 的 字符 表现 形式 称 为 多 字 节 字符 (multi-byte 
character) 。 





由 宽 字 符 组 成 的 字符 串 (也 就 是 wchar_t 的 数组 ) 称 为 宽 字符 
串 。 


代码 清单 4-9 是 用 于 确认 宽 字 符 的 行为 的 程序 *。 


”为 便于 读者 理解 宽 字 符 ， 本 程序 保留 了 原 书 日 文字 符 的 示例 ， 不 影响 读者 对 字符 
串 编码 内 容 的 理解 。 译 者 注 


代码 清单 4-9 wchar t.c 





1 #include <stdio.h> 
2 #include <stddef.h> 
3 #include <wchar.h> 
4 #include <locale.h> 


nt main(void) 

















// 宽 字 符 串 字面 量 
Cwchar t str[] = L" 日 本 语 123 叱 ";) 











// 显示 wchar_t 的 长 度 

printf("sizeof(wchar t)..%d\n", (int)sizeof(wchar t)); 

// 显示 数组 str 的 长 度 

printf("str length..%d\n", (int)(sizeof(str) / sizeof(str[6]))); 





// 输出 str 的 内 容 

for (int i = 6;j i «< (sizeof(str) / sizeof(str[6])); i++) { 
printf("str[%d]..%ex\n", i, str[i]); 

} 


return 0; 





第 9 行 用 宽 字 符 串 字面 量 (wide string literal) 对 
wchar_t 类 型 的 数组 str 进行 了 初始 化 。 像 这 样 在 被 "“" 括 起 来 的 
字符 串 前 加 上 L， 就 可 以 生成 宽 字 符 串 字面 量 。 同 理 ， 宽 字符 常量 写 
成 上 L'a'， 宽 字符 串 末 尾 的 空 字符 写成 L'\6 ' 。 


第 12 行 用 于 确认 该 处 理 环境 中 wchar_t 的 长 度 ， 第 14 行 用 


于 确认 数组 str 的 长 度 。 然 后 ， 从 第 17 行 开始 的 for 循环 用 于 
输出 数组 str 的 内 容 。 


在 我 的 运行 环境 (Ubuntu Linux) 中 ， 运 行 结 果 如 下 所 示 。 


sizeof(wchar 七 ) . .4 
str length..8 
str[6].. 

str[1].. 

str[2].. 


str[3].. 
str[4].. 
str[5].. 
str[6].. 
str[7].. 





如 你 所 见 ，wchar _t 的 长 度 为 4 字 节 。 因 为 一 个 wchar t 表 
示 一 个 字符 ， 所 以 即便 是 a 这 样 的 英语 字母 或 数字 ， 也 需要 使 用 4 
字 节 。 从 某 种 意义 上 来 说 这 有 点 浪费 ， 所 以 在 Windows 上 “即使 使 
用 gcc) wchar t 的 长 度 为 2 字 节 。 


数组 str 的 长 度 〈 在 Linux 中 ) 为 8。 不 过 ， 实 验 一 下 就 会 
知道 ， 在 Windows 中 它 是 9?。 这 是 因为 ， 第 9 行 中 设置 的 字符 串 的 
最 后 的 “ 叱 ”这 个 字符 是 Unicode 中 的 代理 对 字符 ， 无 法 用 2 字 节 
来 表示 。 看 一 下 运行 结果 中 输出 的 值 就 会 发 现 ，str[6] 是 
0x20b9f， 由 于 它 超过 了 2 字 节 的 范围 ， 所 以 即使 在 wchar t 为 4 
字 节 的 Linux 上 能 够 显示 ， 在 Windows 上 也 显示 不 了 ， 必 须 用 2 
个 wchar 上 来 显示 才 可 以 。 


虽然 这 里 已 经 自然 而 然 地 写 上 了 “Unicode”， 而 且 在 目前 大 多 
数 运行 环境 中 宽 字 符 是 通过 Unicode 表示 的 ， 但 099 标准 中 并 没 
有 这 么 规定 *。 


* 由 于 在 C11 中 也 可 以 写 UTF-16 或 UTF-32 的 字面 量 ， 所 以 人 们 就 更 党 得 
Unicode 受到 了 “特殊 对 待 ”。 





在 1 个 字符 要 通过 2 字 节 或 4 字 节 的 整数 类 型 来 表示 的 前 提 
下 ， 如 果 以 字 闻 为 单位 来 分 析 包 含 英语 子 母 或 数字 的 字符 串 ， 束 会 看 
到 值 为 0 的 字 节 会 频繁 地 出 现 ， 因 此 对 于 宽 字 符 串 ， 我 们 无 法 使 用 
像 strcpy() 这 样 的 面向 普通 字符 串 的 函数 ， 而 需要 使 用 像 
wcscpy() 这 样 的 用 于 宽 字 符 串 的 函数 。 


输入 输出 也 是 一 样 ， 不 能 使 用 printf()， 而 要 使 
用 wprintf()。 不 过 ， 由 于 输入 输出 流 自身 会 是 字 节 流 〈byte- 
oriented stream) 或 宽 字 符 流 (wide-oriented stream) 这 两 个 模 
式 中 的 一 个 ， 所 以 printf() 和 wprintf() 通 常 是 不 能 共存 的 。 
此 ， 在 实际 的 程序 中 ， 比 较 常 见 的 做 法 是 将 流 固定 为 字 节 流 ， 然 后 使 
用 wcrtomb( ) 等 对 宽 字 符 与 多 字 节 字符 进行 转换 的 函数 ， 将 宽 字符 转 
换 为 多 字 节 字符 串 并 输出 *。 


”在 printf() 系列 的 函数 中 ， 也 可 以 先 指定 %1s， 将 宽 字符 转换 成 多 字 节 字符 ， 
再 进行 输出 。 


或 许 你 会 党 得 : “ 搞 得 这 么 麻烦 ， 却 还 是 可 能 由 于 混入 了 代理 对 
字符 而 使 结果 出 现 偏 差 ， 这 样 的 话 ， 从 我 们 原本 的 目的 一 一 取出 第 n 
个 字符 来 说 ， 使 用 什么 宽 字符 不 也 没什么 意义 吗 ? ”实际 上 也 确实 有 
人 认为 不 管 什么 内 容 ， 都 放 到 UTF-8 的 多 字 节 字符 串 里 就 可 以 了 。 但 
是 ， 现 在 不 管 是 Java 还 是 C#、JavaScr ipt， 只 要 混入 了 代理 对 字符 ， 
就 都 无 法 从 字符 串 中 选取 正确 的 字符 ， 所 以 我 觉得 ， 在 对 用 途 进行 一 
定 程度 的 限制 的 前 提 下 使 用 宽 字 符 也 算是 一 个 可 以 接受 的 选择 。 


Windows 会 根据 有 无 宏 UNICODE 的 定义 ， 来 确定 TCHAR 类 型 到 底 是 
使 用 char 还 是 wchar_t。 





4-2-2 ”动态 数组 的 动态 数组 


在 4-2-1 市 中 ， 我 们 虽然 实现 了 使 用 动态 数组 表示 单个 标语 ， 但 
标语 的 个 数 是 固定 的 〈7 个 ) 。 


如 果 想 将 任意 行 数 的 文本 文件 加 载 到 内 存 中 ， 就 需要 用 到 “动态 数 
组 的 动态 数组 ”。 


“类 型 T 的 动态 数组 ”可 以 通过 “指向 T 的 指针 ”实现 但 元 素 
个 数 需要 自己 另行 管理 ) 。 


因此 ， 如 果 想 要 获取 “T 的 动态 数组 的 动态 数组 ”， 使 用 “指向 T 
的 指针 的 指针 ”就 可 以 了 (图 4-3) 。 


指向 T 的 指针 的 指针 


[| 
EE 

[LT 

| | | 

[LT 


图 4-3 动态 数组 的 动态 数组 


代码 清单 4-10 是 从 标准 输入 读 取 文 本 文件 ， 先 将 其 加 载 到 内 存 中 
再 输出 到 标准 输出 的 程序 。 为 了 能 够 读 取 任 意 长 度 的 行 ， 这 里 使 用 了 代 
码 清单 4-6 中 的 read_line() 函数 。 


代码 清单 4-10 read file.c 


1 #include <stdio.h> 
2 #include <stdlib.h> 
3 #include xassert.h> 


\O cv 人 
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#define ALLOC SIZE (256) 


#include "read line.h" 


char **add line(char **text data, char *]line, 


{ 


} 


int *line alloc num, int *]ine_ num) 


assert(*]ine alloc num >= *line_ num); 
if (*line alloc num == *]ine num) { 
text data = realloc(text data, 
(*]line alloc num + ALLOC SIZE) * sizeof(char 
*]ine alloc num += ALLOC SIZE; 
} 
text data[*line num] = line; 
(*line_ num)++; 


return text data; 


char **read file(FILE *fp, int *line num p) 


{ 


int 


char **text data = NULL; 
int line _ num = 6; 

int line alloc num = 0@; 
char *]ine; 


while ((line = read line(fp)) != NULL) { 
text data = add line(text data, line, 
&line alloc num, &line num); 








} 

/* 将 text_data 缩 短 到 真正 需要 的 长 度 */ 

text data = realloc(text data, line num * sizeof(char*)); 
*]ine num p = line num; 


return text data; 


main(void) 

char **text data; 
int line_num; 
int be 


text data = read file(stdin, &line_ num); 


for (i = 8; i < line num; i++) { 
printf("%s\n", text data[il]); 


52 } 

53 free_ buffer(); 
54 

55 return ©; 





不 读 到 文件 最 后 ， 就 无 法 获取 全 部 的 行 数 。 因 此 ， 在 
read_file() 中 ， 对 指针 的 数组 也 是 使 用 realloc() 按 顺 序 扩展 其 
内 存 的 〈 第 13 行 第 17 行 ) ”。 


”4-2-1 节 的 注释 中 也 提 到 过 ， 由 于 预测 行 数 比 预 测 每 行 中 的 字符 个 数 更 困难 ， 所 以 


在 每 次 扩展 内 存 时 ， 或 许 不 使 用 常量 值 ALLOC_SIZE， 而 是 使 用 固定 的 倍数 更 好 一 些 。 





在 read_ line() 中 ， 为 了 共享 某 些 变量 ， 我 们 使 用 了 文件 内 的 
static 变量 ， 不 过 这 次 我 们 采用 了 将 指针 作为 参数 进行 传递 的 方法 。 
在 通过 文件 内 static 变量 或 全 局 变量 实现 数据 共享 时 ， 会 造成 完全 
不 知道 值 会 在 哪里 被 改写 的 局 面 ， 并 且 在 多 线程 编程 中 也 会 出 现 问题 ， 
所 以 可 以 说 在 很 多 情况 下 使 用 这 次 的 方法 会 更 好 一 些 。 

4-2-3 ”命令 行 参数 

在 从 命令 行 运 行程 序 时 ， 可 以 通过 命令 行 参数 向 程序 传递 参数 (2- 
5-6 节 的 代码 清单 2-9 中 就 使 用 了 命令 行 参数 ) 。 例 如 ， 在 需要 输出 
文件 内 容 时 ， 如 果 是 在 UNIX 中 ， 可 以 使 用 cat 命令 。 此 时 ， 可 以 像 
下 面 这 样 将 文件 名 传递 给 命令 。 


> Cat hoge.txt 


像 下 面 这 样 将 多 个 文件 名 并 列 书写 ， 输 出 就 是 将 hoge.txt 与 
piyo. txt 连接 后 得 到 的 内 容 “。 


三 


* cat 是 concatenate (连接 ) 的 缩 略 形式 。 





这 时 ， 我 们 无 法 事先 预测 cat 会 有 几 个 参数 ， 也 无 法 预测 各 个 参 
数 〈 文 件 名 ) 的 长 度 。 因 此 ， 可 以 用 代表 “char 的 动态 数组 的 动态 数 
组 ”的 “指向 指针 的 指针 ”表示 。 


程序 中 使 用 main() 沙 数 的 参数 接收 命令 5 令 行 参数 。 在 目前 为 止 的 
示例 程序 中 ，main() 函数 主要 写成 下 面 这 样 。 


int main(void) 


而 在 接收 命令 行 参数 时 ， 要 写成 下 面 这 样 ”。 


”标准 文档 的 5. 1. 2. 2. 1 中 有 相关 叙述 。 





int main(int argc, char *argv[]) 


当然 ， 由 于 在 范 数 的 形 参 中 数组 会 被 解读 为 指针 ， 所 以 写成 下 面 这 
样 也 是 一 样 的 。 


int main(int argc, char **argv) 


如 果 用 图 表示 argv 的 结构 ， 则 如 图 4-4 所 示 。 


Co 


一 一 一 一 
这 里 的 个 数 
ene 和 就 | VQ 





图 4-4 _ argv 的 结构 


argv[6] 站 当 需 要 在 错误 提示 消息 中 显 
示 命 令 名 称 时 "， 或 需要 根据 命令 名 称 改 变 程序 的 行为 时 ， 经 常会 使 用 
argv[6|。 


”在 UNIX 中 ， 我 们 可 以 通过 管道 将 命令 连接 起 来 执行 某 些 处 理 ， 这 时 需要 在 错误 提 


示 消息 中 自 报 家 门 。 





argc 中 保存 的 是 包括 argv[8] 在 内 的 参数 的 个 数 。 实 际 上 ， 从 
ANS1 C 开始 ， 我 们 就 已 经 能 够 保证 argv[argc] 等 于 NULL 了 。 
此 ， 要 是 通过 对 argv 进行 检查 去 确认 参数 个 数 ， 那 其 实 没 有 argc 
也 没什么 关系 ， 不 过 即便 是 现在 ， 大 多 数 程序 还 是 会 去 引用 argc。 


代码 清单 4-11 是 UNIX 的 cat 命令 的 简单 实现 。 


代码 清单 4-11 cat.c 





1 #include <stdio.h> 
2 #include <stdlib.h> 


oid type one file(FILE *fp) 


int ch; 


3 
4 V 
5 1{ 
6 
7 
8 


while ((ch = getc(fp)) != EOF) { 
putchar( ch); 


13 int main(int argc, char **argv) 
14 { 
if (argc == 1) { 
type_one file(stdin); 
} else { 
int 3 
FILE *fp; 


i = 1; i < argc; i++) { 
= fopen(argv[i], "rb"); 
(fp == NULL) { 
fprintf(stderr, "%s:%s can not open.\n", argv[8], argv[i 
exit(1); 
} 
type_one file(fp); 





与 UNIX 的 cat 相同 ， 如 果 不 指 定 参数 ， 就 使 用 标准 输入 第 15 
行 "第 16 行 ) 。 


21 行 第 28 行 的 for 循环 按 顺序 对 参数 中 指定 的 文件 名 进行 
了 处 理 。 


许多 人 遇 到 这 种 情况 时 会 瑞 固 地 拒绝 使 用 循环 计数 器 ， 他 们 更 愿意 
采用 对 argc 进行 减法 或 者 直接 操纵 argv 前 移 的 方法 ， 但 我 还 是 
觉得 ， 通 过 计数 器 访问 下 标的 方式 更 加 容易 理解 。 


4-2-4 通过 参数 返回 指针 





4-2-1 节 中 的 read_line() 函数 《代码 清单 4-6) 的 返回 值 是 读 
取 的 行 ， 读 到 文件 末尾 时 返回 值 为 NULL。 


但 read_line() 返回 的 是 通过 malloc() 分 配 的 内 存 空间 。 代 
码 清单 4-6 省 略 了 对 malloc() 返回 值 的 检查 ， 但 如 果真 的 要 把 
read_line() 封装 成 通用 子 数 ， 就 必须 认真 检查 返回 值 ， 并 将 处 理 状 
态 返 回 给 调用 方 。 


关于 read_line() 返回 给 调用 方 的 处 理 状态 ， 有 下 面 几 种 情况 
)1. 正常 地 读 取 了 1 行 
)2. 读 到 了 文件 末尾 
)3， 因 内 存 不 足 而 失败 

要 是 用 枚 举 类 型 来 表示 ， 则 以 上 几 种 情况 如 下 所 示 。 


typedef enum { 
READ_LINE_SUCCESS，/* 正常 地 读 取 了 1 行 */ 





READ_LINE_EOF，/* 读 到 了 文件 末尾 */ 
READ_LINE_OUT_OF_MEMORY /* 因 内 存 不 足 而 失败 */ 
} ReadLineStatus; 





要 向 调用 方 返 回 状态 ， 首 先 能 够 想到 的 一 种 方法 就 是 将 
read_line() 的 原型 声明 成 下 面 这 样 ， 然 后 通过 参数 返回 。 


char *read line(FILE *fp, ReadLineStatus *status); 


这 个 方法 本 身 是 非常 正确 的 ， 但 某 些 项 目 往往 采取 “状态 应 该 通过 
返回 值 返回 ”的 方针 。 


因此 ， 如 果 返 回 值 被 用 来 返回 状态 ， 那 么 目前 通过 返回 值 返回 的 已 
获取 的 字符 串 就 必须 通过 参数 来 返回 了 。 


前 面 说 过 如 果 想 通过 参数 返回 类 型 T， 使 用 “指向 T 的 指针 ”就 
可 以 了 。 我 们 这 次 想 要 返回 的 类 型 是 “指向 char 的 指针 ”， 因 此 使 
用 “指向 char 的 指针 的 指针 ”就 可 以 了 。 


所 以 ， 原 型 会 变 成 下 面 这 样 。 


ReadLineStatus read line (FILE *fp, char **]ine); 


修订 版 的 头 文件 如 代码 清单 4-12 所 示 ， 代 码 如 代码 清单 4-13 所 


代码 清单 4-12 read line.h (修订 版 ) 


#ifndef READ_LINE_H_INCLUDED 
#define READ_LINE_H_INCLUDED 


#include <stdio.h> 


typedef enum { 
READ_LINE_SUCCESS ， /* 正常 地 读 取 了 1 行 */ 
READ_LINE_ EOF, /* 读 到 了 文件 末尾 */ 
READ_LINE_OUT_OF_MEMORY /* 因 内 存 不 足 而 失败 */ 
} ReadLineStatus; 


1 
2 
3 
4 
5 
6 
7 
8 
9 


卢 
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ReadLineStatus read line(FILE *fp, char **]ine); 
void free buffer(void); 


PP 
WDODP 


上 ”上 
Bp 


#endif /* READ LINE H_ INCLUDED */ 


代码 清单 4-13 ” read line.c〔 修 订 版 ) 





#include 《stdio.h> 
#include <stdlib.h> 
#include “assert.hy> 
#include <string.h> 
#include "read line.h" 


#define ALLOC SIZE (256) 


\O oONOUUBBUWUDOP 


/* 
* 用 于 读 取 行 的 缓冲 区 。 可 根据 需要 进行 扩展 ， 不 会 缩小 
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* 通过 调用 free_buffer() 释 放 绥 冲 
*/ 
static char *st line buffer = NULL; 














/* 
* 给 st_line_buffer 指 向 的 区 域 分 配 的 内 存 空间 的 大 小 
2 


static int st current buffer size = 0; 








/* 
* st_line_buffer 中 当前 保存 的 字符 的 大 小 
*/ 
static int st current used size = 0@; 
/* 
* 向 st_ line_buffer 的 末尾 添加 1 个 字符 


*# 可 根据 需要 对 st_1line_buffer 指 向 的 内 存 空间 进行 扩展 
4 
static ReadLineStatus 
add character(int ch) 
{ 
/* 
* 由 于 st_current_used_size 一 定 是 每 次 增加 1 字 节 
* 所 以 应 该 不 会 出 现 因 以 下 断言 而 突然 跳出 本 函数 的 情况 
WA 


assert(st current buffer size >= st current used size); 





/* 
* 当 st_current used _ size 等 于 st_current buffer_ size 时 
* 对 缓冲 区 进行 扩展 
2 
if (st current buffer size == st current used _ size) { 
char *temp; 
temp = realloc(st line buffer, 
(st current buffer size + ALLOC SIZE) 
* sizeof(char)); 
if (temp == NULL) { 
return READ LINE OUT OF MEMORY; 

















} 

st line buffer = temp; 

st _current buffer size += ALLOC SIZE; 
} 
/* 在 缓冲 区 末尾 添加 1 个 字符 */ 
st line buffer[st current used size] = ch; 
st_ current used sizet+; 














return READ_LINE_ SUCCESS; 
} 
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/* 
* 释放 缓冲 区 。 虽 然 不 调用 本 函数 其 实 也 没什么 区 别 
* 但 如 果 你 想 要 在 程序 结束 时 把 通过 malloc( ) 分 配 的 内 存 空 间 全 部 free( ) 掉 
* 那么 在 最 后 调用 本 函数 即 可 
2 
void free buffer(void) 
{ 
free(st line buffer); 
st line buffer = NULL; 
st _ current buffer size = 0; 
st_ current used size = 0@; 
} 
/* 
* 从 fp 读 取 1 行 
*/ 
ReadLineStatus read line(FILE *fp, char **]ine) 
{ 
int ch ; 
ReadLineStatus status = READ LINE SUCCESS; 
st _ current used size = 0@; 
while ((ch = getc(fp)) != EOF) { 
if (ch == '\n') { 
status = add character('\'); 
if (status != READ LINE SUCCESS) 
goto FUNC_ END; 
break; 
} 
status = add character(ch); 
if (status != READ LINE SUCCESS) 
goto FUNC_END; 
if (ch == EOF) { 
if (st current used size > 06) { 
/* 最 后 一 行 的 后 面 没有 换行 的 情况 */ 
status =add character('\Q'); 
if (status != READ LINE SUCCESS) 
goto FUNC_ END; 
} else { 
status = READ LINE EOF,; 
goto FUNC_END; 
} 
} 
*]ine = malloc(sizeof(char) * st current used size); 
if (*line == NULL) { 


167 status = READ_LINE_OUT_OF_MEMORY; 


1068 goto FUNC_END; 

169 

116 strcpy(*line, st line buffer); 

111 

112 FUNC_END: 

113 if (status != READ LINE SUCCESS && status != READ LINE EOF) { 
114 free_ buffer(); 

115 } 

116 return status; 

117 } 


代码 清单 4-14 main.c 修 订 版 ) 


#include <stdio.h> 
#include "read line.h" 


int main(void) 
char *line; 


while (read line(stdin, &line) != READ LINE EOF) { 
printf("%s\n", line); 


} 
free buffer(); 





在 read line() 中 ， 如 果 malloc() 返回 了 NULL， 程 序 就 会 通 
过 goto 立刻 跳 转 到 FUNC_END。 


FUNC_END 会 在 处 理 失败 时 调用 free_buffer() 释放 缓冲 区 。 由 
于 malloc() 失败 就 意味 着 内 存 不 足 ， 所 以 即使 只 是 释放 这 么 一 点 内 
存 空间 ， 也 可 以 多 少 缓和 一 下 内 存 不 足 的 局 面 ， 使 得 后 面 的 处 理 可 能 能 
够 正常 地 进行 。 


也 有 一 些 人 主张 绝对 不 能 用 goto， 但 对 于 这 样 的 异常 处 理 ， 在 很 
多 情况 下 不 用 goto 就 不 太 好 写 了 ”。 





顺便 提 一 下 ， 第 一 个 抛 出 “goto 有 害 论 ”的 艾 兹 格 ' W， 巡 科斯 彻 
(Edsger W.，Dijkstra) 后 来 曾 发 表 过 以 下 言论 (Literate 
Programming LS1) 。 


“不 要 误会 我 对 goto 语句 持 有 任何 教条 主义 的 执 念 。 我 只 是 担 
忧 ， 很 多 人 把 这 件 事 给 神化 了 ， 甚 至 认为 仅 赁 某 个 编程 技巧 或 茶 个 简 
单 的 编程 原则 ， 就 能 解决 编程 语言 的 概念 问题 ! ” 


要 扣 
在 异常 处 理 中 ， 多 数 情况 下 使 用 goto 可 以 使 代码 更 加 简洁 。 


补充 什么 是 “ 双 指 针 ” 


网 络 上 许多 C 语 言 的 学 习 者 常常 发 牢骚 说 : “ 双 指 针 太 莫 名 其 妙 
了 吧 ! 79 


双 指 针 这 个 说 法 在 C 语 言 的 标准 中 当然 是 不 存在 的 。 这 里 所 谓 的 
双 指 针 ， 其 实 残 是 “指针 的 指针 ”。 


正如 我 们 前 面 看 到 的 那样 ，“ 指 针 的 指针 ”一 般 出 现在 “动态 数 
有 
用 情况 下 o 


在 实际 编写 程序 时 ， 如 果 利 用 指针 进行 多 重 间 接 引 用 ， 程 序 的 行 
为 就 会 变 得 难以 理解 ， 这 是 确实 存在 的 问题 ， 但 从 语法 上 来 说 ， 其 实 





它 并 没有 任何 特别 之 处 ， 所 以 没什么 可 怕 的 。 





4-2-5 将 多 维 数 组 作为 函数 的 参数 传递 


在 5 语言 中 ， 实 际 上 并 不 存在 多 维 数组 ， 看 上 去 像 多 维 数组 的 其 
实 是 “数组 的 数组 ”。 


前 面 说 过 ， 如 果 想 将 类 型 的 数组 作为 参数 传递 ， 传 递 “ 指 向 T 
的 指针 ”就 可 以 了 《4-1-2 市 ) 。 因 此 ， 如 果 想 将 “数组 的 数组 ”作为 
参数 传递 ， 传 递 “ 指 向 数组 的 指针 ”就 可 以 了 。 代 码 清单 4-15 将 
的 二 维 数组 传递 给 了 函数 func()， 然 后 在 func() 中 输出 了 其 
合 。 


代码 清单 4-15 pass 2d _ array.c 





1 
2 
3 
4 
5 int i, j; 
6 
7 for (i = 60; i < 4; i++) { 
8 for (j = 6j j < 3; j++) { 
9 printf("%d, ", hoge[i][j]); 
16 } 
11 putchar('\n'); 
12 } 
13 } 
14 
15 int main(void) 
16 { 
17 int hoge[][3] = { 
18 {1, 2，3}, 
19 {4, 5, 6}, 
26 {7，8，9)}， 
21 {16，11，12}， 


22 }; 


24 func(hoge); 
25 
26 return ©; 





有 人 可 能 会 说 : “int (*hoge)[3] 这 种 莫名 其 妙 的 写法 ， 根 本 看 
不 懂 啊 ! ”如 果 是 这 样 ， 其 实 可 以 把 代码 清单 4-15 的 第 3 行 写 成 下 
面 这 两 种 写法 中 的 任意 一 种 。 


void func(int hoge[][3]) 


void func(int hoge[4][3]) <-- 这 里 的 4 会 被 忽略 掉 


有 人 认为 像 上 面 这 样 写 比 较 容 易 读 懂 ， 对 此 我 也 不 是 不 能 理解 ， 但 
不 论 使 用 哪 种 方式 ， 当 需要 将 接收 的 参数 保存 到 其 他 变量 中 时 ， 或 者 需 
要 通过 malloc() 分 配 多 维 数 组 时 ， 就 必须 使 用 int (*hoge)[3] 的 
ee 3-2-4 节 的 内 容 ， 掌 握 “ 指 向 数组 的 
旧 针 ” 的 写法 。 


4-2-6 将 多 维 数组 作为 函数 的 参数 传递 〈VLA 版 ) 
在 ANS1 C 中 ， 当 把 多 维 数组 传递 给 函数 时 ， 其 最 外 层 以 外 的 元 素 
个 数 必须 是 常量 。 也 就 是 说 ， 在 编写 如 下 原型 声明 时 ， 这 里 的 3 必须 


三 二 = 
契 吊 里 。 


void func(int (*hoge)[3]); 


如 果 通 过 其 他 参数 来 传递 长 度 ， 那 么 最 外 层 的 维度 就 可 以 是 可 变 长 
的 。 也 就 是 说 ， 如 果 写 成 下 面 这 样 。 


hoge[i][j] 的 i 的 最 大 值 就 可 以 是 可 变 长 的 ， 但 j 的 最 大 值 还 
是 固定 的 。 相 信 很 多 人 会 感到 不 便 。 


在 C99 中 ， 如 果 一 个 多 维 数组 的 最 外 层 以 外 的 元 素 个 数 是 可 变 
的 ， 则 可 以 通过 可 变 长 数组 将 该 多 维 数 组 传递 给 数组 〈 代 码 清单 4- 


四 


| 


代码 清单 4-16 pass 2d _ array c99.c 


#include <stdio.h> 


void func(int size1l, int size2, int hoge[size1][size2]) 


{ 


int i, j; 


for (i = 6; i «< size1l; i++) { 
for (j = 6; j < size2; j++) { 
printf("%d, ", hoge[i][j]); 
} 
putchar('\n'); 


} 


int main(void) 
{ 
int hoge[][3] = { 
{1，2，3)}， 
{4, 5, 6}, 
{7,，8,，9}, 
{16，11，12}， 
}; 


func(4, 3, hoge); 


return 0©; 





3-5-2 节 提 到 过 ， 以 下 3 种 写法 意思 相同 。 


/* 原本 是 这 个 意思 */ 
void func(int size1, int size2, int (*hoge)[size2]); 








/* 在 函数 定义 的 形 参 中 ， 数 组 被 解读 为 指针 */ 


void func(int size1, int size2, int hoge[l |][size2]); 





/* 即便 写 了 元 素 个 数 也 会 被 忽略 */ 


void func(int size1, int size2, int hoge[size1][size2]); 





正如 3-6-3 节 中 所 说 ， 我 认为 与 其 说 “只 有 在 声明 函数 形 参 时 才 
能 将 数组 的 声明 解读 成 指针 的 声明 ”这 一 语法 糖 提 高 了 5 语言 的 可 读 
性 ， 不 如 说 它 反而 助长 了 5 语言 中 的 混乱 之 势 。 因 此 ， 虽 然 本 来 应 该 
写成 上 面 的 第 1 种 写法 ， 但 我 认为 就 这 里 的 情况 来 说 ， 第 3 种 写法 能 
够 更 好 地 表达 我 们 的 意图 ， 并 且 更 容易 理解 。 


另外 ， 在 第 3 章 中 我 们 还 提 到 ， 关 于 参数 的 顺序 ， 如 果 想 将 数组 
的 长 度 放 到 数组 之 后 ， 那 么 原型 声明 可 以 写成 下 面 这 样 。 


void func(int hoge[*][*], int size1，int size2); 


请 注意 ， 只 有 原型 声明 才 可 以 采用 这 种 与 法 ， 函 数 定义 要 与 成 下 面 
这 样 。 


void func(int hoge[size1][size2]，int size1, int size2) 





4-2-7 通过 malloc 0 分 配 纵 横 可 变 的 二 维 数 组 〈099 ) 


099 中 的 可 变 长 数组 只 能 用 于 自动 变量 。 但 是 ， 在 实际 需要 使 用 可 
变 长 数组 的 情况 中 ， 其 实 多 半 不 希望 数组 像 自动 变量 那样 在 函数 结束 时 
就 被 释放 皖 ， 而 是 希望 能 够 保存 更 长 的 时 间 。 例 如 在 编 瑟 文本 编辑 器 
时 ， 在 想 要 保存 1 行 大 小 的 字符 串 的 情况 下 ， 由 于 1 行 数据 的 长 度 是 
无 法 预测 的 ， 于 是 就 想 着 使 用 099 的 可 变 长 数组 ， 但 其 实 是 不 能 使 用 
i 

用 o 

看 到 这 里 ， 各 位 读者 或 许 想 说 “ 那 可 变 长 数组 这 东西 根本 就 用 不 
上 嘛 ! ”实际 上 我 也 很 想 发 出 这 样 的 质疑 ， 但 其 实 并 不 能 说 全 都 是 这 样 
i 
写法 。 


比如 ， 不 论 是 黑白 棋 还 是 围棋 ， 又 或 者 是 扫雷 ， 这 些 游戏 的 “ 棋 
盘 ” 都 是 通过 二 维 数组 保存 的 。 黑 白 棋 的 棋盘 一 般 是 8 X 8 的 ,但 也 


可 以 设计 成 在 游戏 中 可 以 选择 更 大 的 棋盘 。 在 这 种 情况 下 ， 就 需要 一 个 
纵横 长 度 可 变 的 二 维 数组 。 


由 于 棋盘 需要 一 直 保 存 到 游戏 结束 为 止 ， 所 以 在 大 多 情况 下 需要 通 
过 malloc() 来 分 配 棋盘 的 内 存 。 


假设 用 int 类 型 表示 棋盘 中 的 1 个 格子 ， 那 么 在 C99 中 ， 通 过 
以 下 写法 就 可 以 得 到 size X size 的 二 维 数组 。 


int (*board)[size] = malloc(sizeof(int) * size * size); 
当然 ， 此 时 通过 board[i][j] 就 可 以 访问 到 棋盘 上 的 各 个 格子 。 


使 用 该 功能 的 示例 程序 如 代码 清单 4-17 所 示 。 该 程序 将 根据 从 键 
盘 输 入 的 长 度 分 配 纵 横 长 度 相 同 的 二 维 数组 ， 并 在 对 其 赋 子 适当 的 信之 
后 将 其 输出 。 


代码 清单 4-17 board.c 





1 #include 《stdio.h> 
2 #include <stdlib.h> 
3 

4 int main(void) 





























5 1 

6 int size; 

7 

8 printf("board size?"); 

9 scanf("%d", &size); 
16 
11 /* 分 配 size x size 的 二 维 数组 */ 
12 int (*board)[size] = malloc(sizeof(int) * size * size); 
13 
14 /* 对 二 维 数组 赋予 适当 的 值 */ 
15 for (int i = 6;j i < size; i++) { 
16 for (int j = 6j j < size; j++) { 
17 board[i][j] = i * size + j; 
18 } 


21 /* 显示 所 赋 的 值 */ 


22 for (int i = 6;j i < size; i++) { 

23 for (int j = 6j j < size; j++) { 
24 printf("%2d, ", board[i][j]); 
25 } 

26 printf("\n"); 


补充 C 语言 中 的 多 维 数组 是 行 优先 的 


在 代码 清单 4-17 中 ， 可 以 通过 board[i][j] 访 问 二 维 数 组 
board， 而 在 这 样 的 二 维 数组 中 ， 在 大 多 数 情况 下 我 们 是 把 横向 当 
作 “X 坐标 ”， 把 纵向 当 作 “Y 坐标 ”考虑 的 。 也 就 是 说 ， 我 们 是 像 
board[x][y] 这 样 访问 数组 的 。 


而 当 我 们 需要 访问 这 样 的 二 维 数 组 时 ， 总 会 在 不 经 意 间 想 要 做 
出 “频繁 地 移动 x 坐标 ”的 访问 。 其 实 与 其 说 是 “ 想 要 ”， 倒 不 如 说 
当 这 样 的 二 维 数组 是 横向 书写 的 ) 文本 编辑 器 的 虚拟 画面 了 时， 就 必 
然 会 这 样 做 。 


但 是 ， 从 5 语言 的 二 维 数 组 的 内 存 分 布 上 来 说 ，board[x][y] 和 
board[x + 1][y] 并 不 是 连续 分 布 的 。 连 续 分 布 的 是 board[x][y] 
和 board[x][y + 1]。 从 C0 语言 的 二 维 数组 是 “数组 的 数组 ”这 一 事 
实 来 看 ， 这 一 点 是 显而易见 的 。 而 频繁 地 访问 内 存 上 离 得 很 远 的 位 
置 ， 就 会 导致 缓存 无 效 化 ， 从 而 对 性 能 造成 恶劣 的 影响 。 


在 这 种 情况 下 ， 解 决 方法 是 写成 board[y][x] 这 种 顺序 ， 这 一 点 
可 能 和 大 家 的 直 党 不 太一 样 。 


在 C 语 言 中 ， 像 这 种 通过 移动 多 维 数组 最 后 的 下 标 就 能 够 访问 连 
续 内 存 的 内 存 分 布 方式 称 为 行 优 先 〈row-major) ， 反 之 称 为 列 优先 
(column-major ) 。FORTRAN 的 多 维 数组 就 是 行 优先 的 分 布 方式 。 





补充 “纵横 可 变 的 二 维 数组 的 ANS1 C 实现 


正如 本 节 前 面 所 说 ，099 中 可 以 通过 malloc() 分 配 纵横 长 度 
可 变 的 二 维 数组 ， 并 可 以 以 array[i][j] 的 形式 对 其 进行 引用 。 那 
么 ，099 以 前 的 ANS1 C 能 够 实现 同样 的 功能 吗 ? 


使 用 4-2-2 节 所 讲 的 技术 ， 融 可 以 以 图 4-5 的 形式 写 出 看 上 去 
像 是 “纵横 长 度 可 变 的 二 维 数 组 ”的 数组 了 。 


| 在 分 配 时 使 宽度 对 齐 | 


图 4-5 ”纵横 可 变 的 二 维 数组 (仿造 版 ) 

但 是 ， 由 于 在 采用 这 种 方法 了 时， 需要 多 次 调用 malloc()， 所 以 
从 速度 和 内 存 这 两 方面 来 看 ， 该 方法 并 不 令 人 满意 。 另 外 ， 在 大 量 
malloc() 之 后 ，free() 会 很 麻烦 ， 这 也 是 一 个 问题 。 


此 处 ， 也 可 以 采用 将 malloc() 的 调用 限制 在 2 次 ， 然 后 像 图 
4-6 这 样 伸 长 指针 的 方法 。 


Eli—— 


图 4-6 ”纵横 可 变 的 二 维 数 组 (仿造 版 :其 二 





当然 ， 不 论 是 图 4-5 还 是 图 4-6， 在 引用 数组 内 容 时 ， 都 可 以 
采用 array[i][j] 的 写法 。 


但 实际 上 ， 与 其 拘泥 于 array[i][j] 而 采用 上 面 这 样 的 写法 ， 


不 如 单纯 地 动态 分 配 一 维 数组 ， 然 后 通过 array[i * width + j] 
引用 数组 内 容 ， 这 才 是 最 轻松 愉快 的 。 


补充 Java 和 C# 的 多 维 数组 


正如 4-1-3 节 的 补充 内 容 中 所 说 ， 如 今 的 语言 大 多 是 将 数组 分 
配 到 堆 中 ， 然 后 通过 引用 〈 即 指针 〉 来 进行 处 理 的 。 

因此 ， 在 用 “数组 的 数组 ”实现 二 维 数组 的 语言 中 ， 二 维 数 组 就 
变 成 了 “指向 数组 的 引用 指针) 的 数组 ”。 例 如 在 Java 中 ， 如 果 
想 用 二 维 数 组 分 配 二 维 折线 (polyline) ， 可 以 写成 下 面 这 样 。 


// nPoints 为 坐标 的 个 数 
double[ ][] polyline = new double[nPoints][2]; 


它 在 内 存 上 的 分 布 如 图 4-7 所 示 。 


polyline 


图 4-7 Java 中 的 折线 (二 维 数组 版 》 


我 们 还 可 以 将 polyline[86] 赋 给 polyline[1]， 或 将 null 
赋 给 polyline[6]。 


在 使 用 这 种 实现 时 ， 我 们 无 法 确定 程序 到 底 是 要 使 用 二 维 数组 ， 





还 是 要 使 用 如 图 4-3 所 示 的 每 个 元 素 的 长 度 可 以 各 不 相同 的 数组 
〈 称 为 交错 数组 ) ， 而 且 性 能 上 也 不 尽 如 人 意 。 


因此 在 C# 中 ， 除 了 和 Java 一 样 的 “数组 的 数组 ”之 外 ， 还 
有 “多维 数 组 ”。 在 利用 cf# 分 配 多 维 数组 时 ， 可 以 写成 下 面 这 样 。 


// nPoints 为 坐标 的 个 数 
double[,] polyline = new double[nPoints, 2]; 


4-2-8 数组 的 动态 数组 
假设 需要 编写 一 个 绘图 工具 ， 我 们 来 考虑 一 下 怎样 实现 二 维 折线 。 


折线 可 以 通过 点 的 动态 数组 实现 。 而 点 是 由 X 坐标 和 Y 坐标 构成 
的 ， 因 此 可 以 通过 “double 的 数组 (元 素 个 数 2) ”表示 。 


所 以 折线 如 下 所 示 。 





double 的 数组 (元 素 个 数 2〉 的 动态 数组 





由 于 “类 型 T 的 动态 数组 ”可 以 通过 “指向 类 型 T 的 指针 ”实现 
“， 所 以 上 面 的 内 容 就 变 成 了 下 面 这 样 。 


”但 元 素 个 数 需要 另行 管理 。 





因此 ， 在 获取 折线 的 内 存 空间 时 ， 写 成 下 面 这 样 就 可 以 了 。 


double (*polyline)[2]; <-- polyline 是 指向 double 的 数组 (元 素 个 数 2) 的 指针 


/* npoints 是 构成 折线 的 坐标 的 个 数 */ 
polyline = malloc(sizeof(double[2]) * npoints ) ; 





如 果 沉 得 不 太 好 理解 ， 可 以 像 下 面 这 样 对 “double 的 数组 〈 元 素 
个 数 2) ”的 部 分 进行 typedef。 


typedef double Point[2]; 


此 时 ，polyline 的 声明 和 内 存 空间 的 分 配 可 以 改 瑟 成 下 面 这 样 。 


Point *polyline; <-- polyline 是 指向 Point 的 指针 


polyline = malloc(sizeof(Point) * npoints); 





是 个 是 感觉 清 歼 了 许多 ? 


不 论 使 用 哪 种 方法 ， 在 想 获取 第 i 个 点 的 X 坐标 时 ， 都 可 以 写成 


这 


本 
到 
公 

楷 


、 


polyline[i][8] 


在 想 要 获取 Y 坐标 时 ， 可 以 写成 下 面 这 样 。 


polyline[i][1] 
但 本 书 不 推荐 使 用 这 种 写法 ， 接 下 来 我 们 说 明 其 原因 。 
4-2-9 ”在 考虑 可 变 之 前 ， 不 妨 考 虑 使 用 结构 体 
在 上 一 证 中， 我 们 使 用 了 “指向 数组 的 指针 ”来 表示 折线 。 
此 时 ， 如 果 有 5 根 折线 ， 那 么 以 什么 样 的 形式 来 管理 才 好 呢 ? 
折线 是 “指向 double 的 数组 (元素 个 数 2) 的 指针 ” 《〈 元 素 个 
数 需要 另行 管理 ) ， 因 此 “折线 的 数组 元 素 个 数 5) ”就 是 “指向 


double 的 数组 元素 个 数 2) 的 指针 的 数组 (元 素 个 数 5) ”， 其 声 
明 如 下 所 示 。 


double (*polylines[5])[2]; 


对 于 读 到 此 处 的 读者 来 说 ， 这 种 程度 的 声明 理解 起 来 应 该 没什么 问 
题 。 但 要 说 它 非 常 容易 读 懂 ， 恐 怕 会 有 许多 人 不 同意 。 


另外 ， 由 于 在 使 用 方法 时 ， 元 素 个 数 《每 根 折线 的 坐标 的 个 数 ) 也 
需要 有 5 份 ， 所 以 我 们 需要 像 下 面 这 样 声 明 相应 的 数组 。 


int npoints[5]; 


如 果 范 数 的 参数 接收 的 折线 数量 不 只 是 5 根 ， 而 是 任意 数量 ， 那 
么 函数 的 原型 应 该 是 下 面 这 样 的 。 


func(int polyline num, double (**polylines)[2], int *npoints); 


如 果 像 下 面 这 样 用 typedef 定义 出 Point 类 型 ， 


typedef double Point[2]; 


就 可 以 将 函数 原型 写成 下 面 这 样 。 


func(int polyline num, Point **polylines, int *npoints); 


如 果 顺 便 定义 了 如 下 声明 ， 


typedef Point *Ppolyline; 
那么 上 面 的 溺 数 原型 就 可 以 写成 下 面 这 样 。 


func(int polyline num, Polyline *polylines, int *npoints); 


可 是 ， 就 算 遂 过 typedef 可 以 大 幅 简 化 声明 ， 但 它 依 然 是 一 个 星 
涩 难 懂 的 声明 。 


最 让 人 不 满意 的 就 是 数组 的 元 素 个 数 必须 由 程序 员 自 己 另 行 


ul 


朋 


还 不 如 干脆 把 Point 定义 成 下 面 这 样 的 结构 体 。 


typedef struct { 
double x; 


double y; 
} Point; 





同时 ， 把 Polyline 定义 成 下 面 这 样 。 


typedef struct { 
int npoints; 


Point *point; 
} Polyline; 





这 样 一 来 ， 就 可 以 将 npoints 和 point 整合 起 来 进行 管理 ， 从 
而 使 代码 变 得 简洁 明了 ， 而 且 也 不 用 再 制定 “X 坐标 是 [6]，Y 坐标 是 
[1]” 之 类 的 奇 芳 规定 了 。 


在 CAD 这 样 的 软件 中 ， 需 要 通过 让 图 形 乘 以 窍 阵 来 进行 坐标 转 
换 。 此 时 ， 如 果 X 坐标 、Y 坐标 是 x、y 这 样 的 结构 体 成 员 ， 残 会 导 
致 无 法 循环 。 这 时 可 以 考虑 将 代码 写成 下 面 这 样 。 


typedef struct { 
double coordinate[2]; 
} Point; 


不 过 ， 如 果 只 是 2D 的 绘图 工具 ， 那 么 使 用 以 x、y 为 成 员 的 结构 
体 就 足够 了 。 


4-2-10 ”可 变 长 结构 体 (ANS1 C 版 ) 
在 上 一 节 中 ， 我 们 以 如 下 方式 定义 了 折线 。 


typedef struct { 
int npoints; 


Point *point; 
} Polyline; 





在 通过 malloc() 为 这 个 Polyline 类 型 本 身 动态 分 配 内 存 空间 
i malloc()， 从 而 在 堆 上 分 配 两 块 内 存 空间 图 
4-8) 。 


Polyline Point 的 数组 


L_ 一 LLLLL 


图 4-8 ”Polyline 的 实现 方法 (其 一 ) 


这 种 方式 虽然 可 以 说 是 十 分 正确 的 ， 但 对 于 通过 malloc() 分 配 
的 每 块 内 存 空间 ， 通 常 还 必须 留 出 一 份额 外 的 管理 空间 ， 此 外 还 存在 伴 
ha (第 2 章 ) 。 此 时 ， 不妨 先 将 Polyline 类 型 声明 成 下 面 
这 样 。 


typedef struct { 
int npoints; 


Point point[1]; 
} Polyline; 


再 像 下 面 这 样 分 配 内 存 空 间 。 





Polyline *polyline; 


polyline = malloc(sizeof(Polyline) + sizeof(Point) * (npoints-1)); 
npoints 是 点 的 个 数 [] 





然后 ， 在 通过 polyline->point[3] 进行 引用 的 情况 下 ， 由 于 
Polyline 类 型 的 point 成 员 是 元 素 个 数 为 1 的 数组 ， 所 以 这 里 就 会 
发 生 对 数组 的 越界 引用 ， 但 好 在 大 多 数 C 语言 的 运行 环境 不 会 进行 数 
组 范围 检查 ， 而 且 Polyline 的 后 面 也 的 确 通过 malloc() 分 配 了 所 
需 的 内 存 空间 (图 4-9) 。 


Polyline 


Polyline 
point [0] 


到 此 处 为 止 


但 由 于 已 经 用 malloc() 分 一 》 nda 
配 了 该 部 分 所 需 的 内 存 , 所 以 
程序 应 该 能 够 正常 运行 


图 4-9 ”Polyline 的 实现 方法 (其 二 


这 样 写 的 话 ， 只 要 是 结构 体 的 最 后 一 个 成 员 ， 融 可 以 不 通过 指针 而 
直接 存放 可 变 长 的 数组 。 从 结构 体 本 身 的 长 度 似 乎 ) 可 变 的 意义 上 来 





说 ， 我 们 可 以 将 该 技巧 称 为 可 变 长 结构 体 〈 虽 然 并 不 是 通用 的 名 称 ) 。 


另外 ， 虽 说 如 果 Polyline 类 型 的 成 员 point 可 以 声明 成 
point[6]， 在 malloc() 时 就 无 须 进行 npoints - 1 这 样 的 调整 
了 ， 但 在 5 语言 中 ， 数 组 的 元 素 个 数 必须 大 于 0。 虽 然 某 些 运行 环境 
(gcc 等 ) 的 确 允 许 声 明 数 组 的 元 素 个 数 为 0， 但 无 论 怎么 说 ， 那 也 只 
是 在 特定 环境 下 的 实现 。 


但 是 ， 可 变 长 结构 体 的 技巧 并 不 总 是 有 效 。 例 如 ， 在 想 要 增加 某 个 
Polyline 的 坐标 的 个 数 时 ， 如 果 另 行 分 配 了 Point 的 数组 ， 只 要 通 
过 realloc() 重新 连接 分 配 Point 的 数组 就 可 以 解决 问题 了 ， 但 如 
果 使 用 了 可 变 长 结构 体 ， 就 需要 对 每 个 Polyline 都 执行 一 下 
realloc()。 这 样 一 来 ，Polyline 本 身 的 地 址 很 可 能 发 生变 化 ， 所 以 
如 果 存 在 大 量 保存 了 指向 该 Polyline 的 指针 的 指针 变量 ， 就 必须 将 
这 些 指针 变量 全 部 更 新 一 遍 ， 非 常 麻烦 。 


或 者 说 ， 在 将 结构 体 整个 保存 在 文件 中 时 ， 或 者 通过 进程 间 通 信 、 
网 络 将 结构 体 传递 给 其 他 程序 时 ， 该 技巧 才 会 较 好 地 发 挥 其 作用 。 虽 
然 在 通过 fwrite() 等 对 结构 体 进 行 转 储 时 ，fwrite() 不 会 为 我 们 
输出 指针 指向 的 内 容 ， 但 如 果 使 用 可 变 长 结构 体 ， 由 于 可 变 长 结构 体 本 
身 只 占用 一 块 内 存 空间 ， 所 以 能 够 简单 地 对 数据 整体 进行 转 储 。 另 外 ， 
读 取 时 也 一 样 ， 如 果 使 用 fread() 等 统一 进行 读 取 ， 就 能 够 将 数据 整 


”当然 ， 正 如 2-8 节 所 述 ， 将 结构 体 整 个 保存 到 文件 中 或 者 传输 到 网 络 上 的 做 法 本 身 


是 有 问题 的 ， 但 如 果 是 在 同一 台 机 器 上 通过 临时 文件 接收 和 传递 信息 ， 或 者 在 同一 台 机 器 上 
进行 进程 间 通 信 ， 那 么 使 用 这 种 技巧 应 该 也 没有 什么 问题 。 





但 是 ， 不 管 怎样 ， 从 ANS1 5 的 语法 来 看 ， 这 种 技巧 都 属于 犯规 技 
巧 。 因 为 5 语言 的 标准 是 不 保证 越 弄 访问 数组 的 行为 的 。 


话 虽 如 此 ， 由 于 这 种 手法 在 大 多 数 环境 中 可 以 使 用 ， 所 以 在 其 能 
有 效 使 用 的 情况 下 ， 我 认为 没有 必要 特意 避 开 。 因 为 书写 严格 遵守 标准 
的 程序 其 实 并 没有 太 大 的 意义 。 


补充 “关于 分 配 可 变 长 结构 体 时 的 长 度 指定 


在 通过 malloc() 分 配 可 变 长 结构 体 的 内 存 空间 时 ， 本 节 是 像 
下 面 这 样 写 的 。 


Polyline *polyline; 
polyline = malloc(sizeof(Polyline) + sizeof(Point) * 
(npoints-1)); 

[jnpoints 是 点 的 个 数 





但 是 ， 由 于 结构 体 的 末尾 有 时 会 加 入 填充 内 容 ， 所 以 在 这 种 情况 
下 ， 该 方法 多 少 会 造成 一 些 内 存 浪费 。 例 如 ， 在 只 能 将 double 配 
置 成 8 字 节 的 环境 中 ， 如 下 所 示 的 结构 体 的 长 度 就 会 是 16。 否 
则 ，Struct 的 数组 的 长 度 就 不 是 “sizeof(Struct) X 元 素 个 
数 ” 了 。 
typedef struct { 

double d; 


char c_array[1] 
} Struct; 


当 该 结构 体 末 尾 的 c_array 为 可 变 长 时 ， 如 果 使 用 以 下 写法 ， 
那么 填充 部 分 的 7 字 节 就 浪费 掉 了 。 


p = malloc(sizeof(Struct) + size - 1); 


或 许 有 人 觉得 这 种 程度 的 浪费 根本 无 所 谓 ， 其 实 我 也 是 不 太 在 意 
的 。 如 果 你 感到 介意 ， 那 么 可 以 使 用 下 面 的 写法 。 


p = malloc(offsetof(Struct, c array) + size); 


offset() 是 在 stddef.h 中 定义 的 宏 ， 它 会 返回 结构 体 成 员 在 
结构 体 中 所 处 的 位 置 〈 位 于 第 几 个 字 节 ) 。 





4-2-11 柔性 数组 成 员 (C99) 


在 ANS1 C 中 可 变 长 结构 体 的 技巧 总 归还 是 犯规 技巧 ， 但 在 099 
中 ， 它 已 经 作为 柔性 数组 成 员 正 式 地 被 纳入 语言 规范 了 。 


使 用 柔性 数组 成 员 ， 折 线 的 结构 体 可 以 声明 成 下 面 这 样 。 


typedef struct { 
int npoints; 


Point point[]; // 请 注意 ， 这 里 没有 写 元 素 个 数 
} Polyline; 








在 实际 分 配 内 存 空间 时 ， 要 写成 下 面 这 样 。 


Polyline *polyline; 
polyline = malloc(sizeof(Polyline) + sizeof(Point) * npoints); 


npoints 是 点 的 个 数 [] 





与 在 ANS1 C6 中 钢 锡 强 强 地 实现 可 变 长 结构 体 时 不 同 ， 这 里 不 需要 
像 npoints - 1 这 样 减 1。 


另外 ， 对 于 在 具有 和 柔性 数组 成 员 的 结构 体 中 使 用 sizeof 运算 符 
后 得 到 的 结果 ，099 中 规定 结构 体 的 长 度 应 当 等 于 “使 用 未 指定 长 度 的 
数组 蔡 换 柔性 数组 成 员 ， 其 他 部 分 都 保持 不 变 ” 的 结构 体 的 最 后 一 个 成 
员 的 偏 移 量 *。 因 此 ， 结 构 体 的 未 尾 也 不 会 有 填充 。 


* 该 规定 出 自 C99 的 6.7.2.1 节 ， 原 文 如 下 : the size of the structure shall 
be equal to the offset of the last element of an otherwise identical structure 
that replaces the flexible array member with an array of unspecified length. 
译 者 注 


补充 “指针 可 以 指向 数组 的 最 后 一 个 元 素 的 下 一 个 元 素 
我 们 曾 多 次 提 到 ， 在 5 语言 中 ， 越 弄 访 问 数 组 的 行为 基本 上 是 不 





被 认可 的 。 严 格 来 说 ， 可 变 长 结构 体 的 技巧 也 是 违反 标准 的 ， 正 如 1- 
3-5 节 的 “注意 ! ”中 所 写 ， 通 过 指针 运算 使 指针 指向 数组 范围 以 外 
的 地 方 的 行为 是 违反 标准 的 ， 哪 怕 最 后 并 没有 通过 该 指针 进行 访问 。 


但 是 ， 对 于 指向 数组 的 “最 后 一 个 元 素 的 下 一 个 元 素 ” 的 指针 ， 
标准 却 认可 了 它 的 存在 。 


ANS1 C Rationale 中 以 以 下 示例 作为 理由 。 


SOMETYPE array[SPAN]; 
米 


At i 
for (p = &array[6]; p < &array[SPAN]; p++) 


这 是 不 使 用 循环 计数 器 ， 而 使 用 指针 来 遍历 数组 array 的 各 个 元 
素 的 循环 。 

那么 在 这 个 循环 结束 时 ，p 指 向 了 哪里 呢 ? 答案 
是 &array[SPAN]。 也 就 是 说 ， 它 指向 了 array 的 最 后 一 个 元 素 的 下 
一 个 元 素 的 位 置 。 


为 了 能 够 兼顾 这 样 的 老 代 码 ，C 语 言 的 标准 才 允 许 了 指针 指向 数 
组 的 “最 后 一 个 元 素 的 下 一 个 元 素 ”。 


话说 回来 ， 本 书 的 建议 是 放弃 使 用 指针 运算 ， 而 使 用 下 标 访问 。 


如 果 从 前 大 家 就 都 这 么 做 ， 那 么 标准 里 也 就 无 须 放 进 这 么 奇 配 的 
例外 规则 了 ”。 


”不 过 ， 以 前 倒是 可 以 使 用 指针 运算 写 出 效率 更 高 的 代码 。 





‖ 第 5 章 


数据 结构 一 一 指针 的 真正 用 法 





5-1 ”案例 学 习 1: 计算 单词 的 使 用 频率 


前 4 章 主要 讲解 了 5 语言 中 声明 的 解读 方法 以 及 数组 与 指针 之 间 
微妙 的 关系 。 


这 些 话题 都 属于 5 语言 特有 的 内 容 ， 因 此 人 们 经 常 抱怨 5 语言 的 
旨 针 很 难 。 


但 一 般 说 到 指针 ， 指 的 是 构造 链表 或 树 形 结构 这 种 数据 结构 所 必需 
的 概念  。 因 此 ， 比 较 正 统 的 编程 语言 中 毫 无 疑问 地 存在 指针 。 本 章 将 
从 构造 更 为 通用 的 数据 结构 的 角度 对 指针 的 用 法 进行 说 明 。 


”对 于 链表 这 种 程度 的 数据 结构 ， 如 果 有 了 集合 库 ， 在 使 用 它 时 就 无 须 顾及 指针 。 





5-1-1 案例 的 需求 
这 里 我 们 看 一 下 求 单 词 出 现 频率 的 程序 ， 借 此 例题 说 明 一 下 指针 的 


7 
我 们 将 程序 命名 为 word_count。 


> word_count 文件 名 


像 这 样 将 英语 文本 文件 的 文件 名 作为 命令 行 参数 传递 给 程序 并 运 
行 ， 程 序 就 会 按照 字母 顺序 对 该 文件 中 包含 的 英语 单词 进行 排序 ， 并 加 
上 各 个 单词 出 现 的 次 数 ， 然 后 将 结果 输出 到 标准 输出 。 


当 参 数 被 省 略 时 ， 程 序 就 对 从 标准 输入 获取 的 输入 内 容 进 行 处 理 。 


补充 “各 种 语言 中 指针 的 叫 法 


正如 我 们 多 次 提 到 的 那样 ， 如 果 没 有 指针 ， 就 无 法 构造 真正 的 数 
据 结 构 ， 因 此 只 要 是 比较 正统 的 编程 语言 ， 其 中 就 膏 无 疑问 地 存在 指 
针 。 以 前 曾 有 人 声称 “Java 中 没有 指针 ”， 但 这 只 是 个 恶劣 的 谣 
言 。Java 中 也 是 有 指针 的 ， 只 不 过 在 Java 中 ， 它 被 称 为 “ 引 
用 ”。Java 是 只 能 通过 指针 来 处 理 数组 及 对 象 的 语言 ， 因 此 在 Java 
中 要 比 在 5 语言 中 更 加 关注 指针 才 行 。 


”现在 应 该 没 人 这 么 说 了 。 


但 是 ，Java 的 引用 与 5 语言 的 指针 不 同 ， 不 存在 指针 运算 或 与 
数组 的 兼容 ， 也 不 能 获取 指向 变量 的 指针 ， 但 如 果 因 此 就 主张 “Java 


中 没有 指针 ”， 那 么 Pascal 中 就 也 没有 指针 了 。 

在 不 同 语言 中 ， 对 相当 于 指针 的 对 象 的 叫 法 也 各 不 相同 ， 除 了 
Java 之 外 ，Lisp、Smalltalk、Perl (Ver.5 之 后 ) 、Ruby、Python 
等 都 把 相当 于 指针 的 对 象 称 为 “引用 ”。 


Pascal、Modula 2、Modula 3 与 C 语言 相同 ， 都 称 之 为 “ 指 
和 


Ada 中 则 称 之 为 “访问 类 型 ”， 真 搞 不 懂 为 什么 会 起 这 个 名 字 。 


比较 麻烦 的 是 ct+，“ 指 针 ” 与 “引用 ”在 语法 上 是 作为 互 不 相 
同 的 概念 存在 的 。 





在 C++ 中 ，“ 指 针 ” 与 C 语言 、Pascal 中 的 “指针 ”， 以 及 
Java 等 语言 中 的 “引用 ” 同 义 ， 而 “引用 ”与 Java 等 语言 中 
的 “引用 ”是 不 同 的 概念 ，C++ 中 的 “引用 ”原本 应 该 称 为 “ 别 
名 ” (alias) 。 正 因为 是 别名 ， 所 以 一 旦 决定 了 它 是 “什么 的 别 
名 ”， 就 不 能 再 更 改 了 。 


请 大 家 注意 ， 不 要 因为 岂 法 相同 就 把 C++ 中 的 “引用 ”与 其 他 
语言 的 “引用 ”混淆 起 来 ， 否 则 会 引起 混乱 。 


补充 引用 传递 
关于 “引用 ”这 个 词 ， 还 有 另外 一 个 话题 。 
在 C 语 言 中 ， 疝 郧 数 传递 参数 时 只 能 使 用 值 传递 ，5C 语 言 没 有 引用 


传递 的 功能 。 


不 只 是 0 语言， 如 今 的 大 多 数 编程 语言 默认 是 值 传 递 的 。C++ 和 0C# 
中 虽然 有 引用 传递 的 功能 ， 但 这 是 可 选 的 ， 并 且 各 自 都 需要 特别 地 指 
定 〈C++ 中 用 & 指 定 、c# 中 用 ref 指 定 ) 。 


尽管 如 此 ， 网 络 上 仍然 随处 可 见 诸如 “5 语言 中 数组 是 引用 传递 
的 ”“Java 中 数组 和 对 象 是 引用 传递 的 ”“Python 的 参数 全 部 都 是 
引用 传递 的 ”等 莫名 其 妙 的 说 明 。 这 里 必须 澄清 一 下 : 上 面 的 这 些 说 
明 都 是 错误 的 。 


所 谓 引 用 传递 (cal1 by reference) ， 就 是 指 被 调用 方 对 参数 


进行 的 更 改 会 原封 不 动 地 反映 到 调用 方 的 参数 上 。 我 们 举 一 个 在 C++ 
中 使 用 引用 传递 的 例子 ， 如 代码 清单 5-1 所 示 。 


| 代码 清单 5-1 callbyreference. cpp 





#include <cstdio> 


void swap(int &a, int &b) 
{ 


int temp; 

temp = a; 
b; 

b = temp; 

main(void) 


int a 
int b 


106; 
20; 
swap(a, b); 


printf("a..%d, b..%d\n", a, b); 





代码 清单 5-1 实现 了 用 于 交换 两 个 变量 的 值 的 swap() 函数 。 
0 main() 函数 的 局 部 变量 a 和 b 的 值 通过 调用 swap() 
被 改变 了 。 


可 能 有 人 会 说 : “这 样 一 来 ，Java 的 数组 不 也 是 引用 传递 了 
吗 ? ”然而 事实 并 不 是 这 样 的 。 我 们 试 着 用 Java 的 数组 编写 了 
swap () 函数 〈 代 码 清单 5-2) ， 通 过 运行 结果 可 以 看 出 ，a 与 b 并 
没有 被 交换 。 


代码 清单 5-2 JavaSwap. java 





1 import java.util.Arrays; 
2 


3 class JavaSwap { 


4 public static 
5 int[] a 

6 int[] b 
7 


void main(String[] args) { 
new int[] {1, 2}; 
new int[] {3, 4}; 


8 System.out.println("a.." + Arrays.tostring(a) 


9 + ", b.." + Arrays.toString(b)); 
16 swap(a, b); 

11 System.out.println("a.." + Arrays.toString(a) 

12 + ", b.." + Arrays.toString(b)); 
13 } 

14 

15 private static void swap(int[] a, int[] b) { 

16 int[] temp; 

17 

18 temp = a; 

19 a=b; 

20 b = temp; 





运行 结果 如 下 所 示 。 


>java JavaSwap 


a..[1, 2], b..[3, 4] 
a..[1，2]，b..[3，4] <-- 调用 了 swap()， 但 没有 发 生 任何 变化 








Java 的 数组 是 引用 类 型 ， 因 此 应 该 可 以 通过 改写 a 或 b 指向 
的 数组 来 改写 从 调用 方 传递 过 来 的 数组 的 内 容 。 然 而 ， 被 指定 为 参数 
的 a 和 b 是 不 能 被 改 瑟 的 ， 因 此 这 根本 称 不 上 是 引用 传递 。 


关于 Java 中 的 数组 类 型 变量 的 接收 和 传递 ， 可 以 用 图 5-1 说 
明 。 


: ; 参数 a 和 b 被 
; ; 调用 ( 值 传递 ) 


a 和 b 所 指向 的 
数组 将 被 共享 


图 5-1 Java 中 的 数组 的 接收 和 传递 


在 代码 清单 5-2 中 ， 虽 然 交 换 了 人 参数 a 和 b， 但 并 未 对 调用 方 产生 
影响 ， 那 是 因为 Java 的 数组 也 一 样 ，“ 与 C 语 言 、Java 的 原始 类 型 一 
样 ) 在 将 其 作为 参数 传递 时 ， 传 递 的 是 副本 。 也 就 是 说 ， 这 就 是 单纯 
的 值 传 递 。 只 不 过 ， 由 于 被 值 传递 的 是 引用 〈 即 6 语言 中 的 指针 〉， 
所 以 在 被 调用 方 ， 它 所 指向 的 内 容 是 可 以 被 改写 的 。 


有 时 这 也 叫 作 “引用 的 值 传递 ”， 但 只 不 过 被 传递 的 是 引用 而 
已 ， 其 本 质 上 还 是 值 传递 。 我 也 曾经 听 到 过 “既然 传递 的 是 引用 ， 那 
就 把 它 叫 作 引 用 传递 不 就 好 了 嘛 ”这 种 任性 的 主张 ， 但 专业 术语 可 不 
是 这 么 轻率 不 负责 任 的。 要 是 仅 赁 感觉 就 随意 改变 定义 ， 那 人 们 就 无 
法 交流 了 。 


”话说 回来 ，“ 引 用 传递 ”这 个 词 原本 指 的 只 是 Pascal 中 的 “变量 参数 ”的 实现 
手段 ， 现 在 却 被 用 来 表示 参数 的 传递 方式 ， 实 属 不 幸 。 





5=-1-2 设计 


在 开发 大 型 程序 时 ， 将 程序 分 割 成 多 个 功能 单元 《模块 ) 非常 重 
nn 
块 。 


假设 需要 如 图 5-2 所 示 对 word_count 程序 整体 进行 分 割 。 


主 例 程 





word :initialize 


单词 















add word 
要 求 输出 结果 
GEE SD | set_wora A 





word finalize 


图 5-2 ”word_count 的 模块 结构 
)1. 单词 获取 单元 
从 输入 流 “ 文 件 等 ) 一 个 一 个 地 获取 单词 。 


]2. 单词 管理 单元 
管理 单词 。 最 终 的 输出 功能 也 要 在 这 里 。 


)3. 主 例 程 
统一 管理 上 述 两 个 模块 。 


关于 单词 获取 单元 的 实现 ， 我 们 已 经 在 1-4-6 市 中 写 过 了 ， 这 里 
可 以 直接 使 用 “。 


| 





”本 书 的 内 容 安 排 都 是 有 预谋 的 ， 哈 哈 ! 


在 get_word() 中 ， 调 用 方 对 单词 的 字符 个 数 进行 了 限制 。 虽 然 
也 存在 无 论 如 何 这 一 限制 都 不 受 认可 的 情况 “， 但 这 里 我 们 暂且 不 去 理 
会 这 些 问题 。 临 时 缓冲 区 取 1024 个 字 节 应 该 就 足够 了 。 


”此 时 ， 可 以 考虑 采用 4-2-4 节 中 介绍 的 方法 。 





关于 “英语 单词 ”的 定义 也 一 样 ， 如 果 严 密 地 去 考虑 ， 那 就 没完 没 
了 了 ， 因 此 这 里 就 结合 已 经 编写 完成 的 get_word() 的 实现 ， 将 通过 
C 语言 的 宏 isalnum() (ctype. h) 返回 真 的 连续 的 字符 视 作 单词 。 


单词 获取 单元 对 其 他 单元 的 接口 如 代码 清单 5-3 所 示 。 单 词 获取 
单元 的 使 用 者 只 要 #include 该 头 文件 即 可 。 


代码 清单 5-3 get word.h 


#ifndef GET_ WORD H_INCLUDED 
#define GET WORD H_INCLUDED 
#include <stdio.h> 


int get word(char *buf, int size, FILE *stream); 





#endif /* GET_WORD_H_INCLUDED */ 
接 下 来 看 一 下 本 次 的 主题 一 一 单词 管理 单元 。 
单词 管理 单元 提供 了 以 下 4 个 函数 作为 外 部 接口 。 
)1. 初始 化 


void word initialize(void); 

对 单词 管理 单元 进行 初始 化 。 使 用 单词 管理 单元 的 一 方 必须 在 
一 开始 就 调用 word_initialize()。 

单词 的 添加 

void add word(char *word); 

向 单词 管理 单元 添加 单词 。 

add_word() 为 传递 进来 的 字符 串 动态 分 配 所 需 的 内 存 空间 ， 
并 将 字符 串 保 存在 该 内 存 空间 内 。 

单词 出 现 频 率 的 输出 

void dump word(FILE *fp); 

按 字母 顺序 对 通过 add_word() 添加 的 单词 进行 排序 ， 并 附 
加 上 各 个 单词 的 出 现 次 数 〈 调 用 add_word() 的 次 数 ) ， 然 后 输 
出 到 通过 fp 指定 的 流 。 

结束 处 理 

void word finalize(void); 


对 单词 管理 单元 进行 结束 处 理 。 当 单词 管理 单元 使 用 完毕 时 ， 
最 后 应 该 调用 word_finalize()。 

在 调用 word_finalize() 之 后 调用 word_initialize()， 
就 可 以 重新 开始 〈 在 此 前 添加 的 单词 被 清空 的 状态 下 ) 使 用 单词 管 
理 单 元 了 。 

将 上 述 内 容 整 理 成 头 文件 ， 得 到 代码 清单 5-4。 


| 
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代码 清单 5-4 word _manage. 


#ifndef WORD MANAGE H_INCLUDED 
#define WORD MANAGE H_INCLUDED 


#include “st 


void word_ in 
void add wor 
void dump_wo 
void word fi 


dio.h> 


itialize(void); 
d(char *word); 
rd(FILE *fp); 
nalize(void); 





#endif /* WORD MANAGE H_INCLUDED */ 


主 例 程 只 需 针对 输入 的 内 容 奋 力 地 调用 get_word()， 然 后 从 右 往 
左 地 执行 add_word()， 并 在 最 后 调用 dump_word() 即 可 ， 如 代码 清 


5—5 所 示 。 


代码 清单 5-5 main.c 


#include 《st 
#include 《st 
#include "ge 
#include "wo 


#define WORD 


int main(int 


{ 


char 
FILE 


if ( 





dio.h> 
dlib.h> 

七 word.h” 
rd_manage.h" 


LEN MAX (1624) 
argc, char **argv) 


buf[WORD_LEN_MAX]; 
*fp; 


fopen(argv[1], "r"); 

fp == NULL) { 

fprintf(stderr, "%s:%s can not open.\n", argv[6], argv[1]); 
exit(1); 


26 } 

































































21 } 

22 

23 /* 初始 化 单词 管理 单元 */ 

24 word initialize(); 

25 

26 /* 一 边 读 入 文件 ， 一 边 添 加 单词 */ 
27 while (get word(buf, WORD LEN MAX, fp) != EOF) { 
28 add word(buf); 

29 } 

30 /* 输出 单词 的 出 现 频率 7 

31 dump_word(stdout ) ; 

32 

33 /* 单词 管理 单元 的 结束 处 理 */ 

34 word finalize(); 

35 

36 return 0©; 





在 代码 清单 5-5 中 ， 我 们 特意 为 WORD_LEN_MAX 取 了 一 个 比较 大 
的 值 ， 但 这 只 是 提供 给 临时 缓冲 区 的 空间 的 大 小 。add_word() 会 自行 
分 配 所 需 的 内 存 空间 ， 然 后 将 字符 串 复制 到 那里 (需求 中 也 是 这 么 写 
的 ) ， 因 此 并 不 会 浪费 太 多 的 内 存 空间 。 


另外 ， 为 使 示例 程序 简单 明了 ， 本 章 中 的 所 有 程序 都 省 略 了 对 
malloc() 的 返回 值 的 检查 。 


补充 “关于 头 文件 的 写法 
在 编写 头 文 件 时 ， 有 两 大 必须 遵守 的 原则 。 


所 有 的 头 文 件 中 都 要 添加 用 于 防止 重复 #include 的 保护 。 
所 有 的 头 文件 都 可 以 被 单独 地 #include。 


所 谓 “ 用 于 防止 重复 #include 的 保护 ”， 就 是 


word_manage. h (代码 清单 5-4) 中 也 写 过 的 下 面 这 样 的 代码 。 


#ifndef WORD MANAGE _H_INCLUDED 
#define WORD MANAGE _H_INCLUDED 





| endif /* NORD_MANAGE_H_INCLUDED */ 


像 上 面 这 样 添加 了 保护 之 后 ， 当 该 头 文件 被 多 次 #include 
时 ， 其 内 容 全 都 会 被 无 视 ， 因 此 不 会 出 现 重 复 定 义 的 错误 。 


第 二 个 原则 是 ， 如 果 在 某 个 头 文件 《假设 为 a.h) 中 需要 用 到 其 
他 的 头 文件 (b.h) (a.h 中 使 用 了 b.h 中 定义 的 类 型 或 宏 ) ， 就 要 
在 a.h 的 开头 #include b.h。 例 如 ， 由 于 word _manage.h 中 使 用 
了 FILE 结构 体 ， 所 以 word_manage.h 中 就 #include 了 
stdio. h。 


虽然 有 不 少 人 对 #include 的 藤 套 感到 厌恶 “， 但 当 a.h 中 需 
要 用 到 b. h 时 ， 如 果 不 使 用 #include 的 窦 套 ， 就 要 在 所 有 使 用 
a.h 的 地 方 写 下 面 这 样 的 代码 。 


”论述 C 语 言 编程 风格 指南 的 经 典 论文 《印第安 山 风格 指南 》 ( 即 Indian Hill C 
Style and Coding Standards) 中 也 表达 了 “不 要 使 用 #include 骨 套 ”的 观点 。 可 
是 ， 不 管 是 在 附属 于 C6 语言 运行 环境 的 头 文 件 中 ， 还 是 在 被 广泛 使 用 的 开源 软件 中 ， 头 
文件 都 经 常 被 舱 套 使 用 。 


#include "b.h" 
#include "a.h" 





没 人 会 干 这 样 的 傻 事 。 这 样 写 不 但 麻烦 ， 而 且 就 算 将 来 情况 发 生 
了 变化 ，a.h 不 再 依赖 于 b.h 了 ， 这 两 行 代码 恐怕 也 还 是 会 永远 地 
a a 另外 ， 如 果 这 么 做 ， 在 开发 现场 的 程序 员 就 会 做 出 以 下 
的 /x 


究竟 是 哪个 文件 依赖 于 哪个 文件 啊 ? 真是 搞 不 明白 ， 那 就 干脆 照 
搬 已 经 通过 编译 的 .c 文件 中 开头 的 #include 吧 。 


这 样 一 来 ， 原 本 并 不 需要 的 头 文 件 就 会 源源 不 断 地 被 #include 


Makefi le 〈 假 设 用 手工 编写 ) 的 依赖 关系 现在 都 是 用 工具 (gcc 


的 -MM 选项 等 ) 自动 生成 的 ， 所 以 藤 套 头 文件 不 会 带 来 什么 麻烦 。 


天 于 头 文件 ， 还 有 一 项 叫 作 “应 将 公有 与 私有 分 开 ” 的 原则 ， 我 
们 会 在 后 面 进行 讲述 。 


要 点 
在 编写 头 文 件 时 必须 遵守 以 下 原则 。 


所 有 的 头 文件 中 都 要 添加 用 于 防止 重复 #include 的 保护 。 
所 有 的 头 文件 都 可 以 被 单独 地 #include。 





5-1-3 数组 版 


我 们 先 来 讨论 一 下 如 何 使 用 数组 实现 word_count 的 单词 管理 单元 
的 数据 结构 。 


在 使 用 数组 管理 单词 时 ， 可 以 考虑 以 下 方法 。 

)1. 将 单词 与 其 出 现 次 数 整合 成 结构 体 。 

)2. 生成 该 结构 体 的 数组 ， 以 此 管理 各 个 单词 的 出 现 频 率 。 

)3. 为 简化 单词 的 添加 与 结果 输出 ， 总 是 以 按 单词 的 字母 顺序 排序 的 形 
式 对 数组 进行 管理 。 


基于 此 方针 编写 的 头 文件 为 word_manage_p. h《〈 代 码 清单 5-6) 。 


代码 清单 5-6 word_manage_p. h〈 数 组 版 ) 





1 #ifndef WORD MANAGE P_H_INCLUDED 
2 #define WORD MANAGE P_H_INCLUDED 


3 #include "word manage.h" 


4 

5 typedef struct { 

6 char *name; 

7 int count; 

8 } Word; 

9 
16 #define WORD NUM MAX (16666) 
11 
12 extern Word word_array[]; 
13 extern int num_ of word; 
14 


15 #endif /* WORD MANAGE P_H_INCLUDED */ 





关于 向 该 数组 添加 新 单词 的 步骤 ， 首 先 可 以 考虑 以 下 方法 。 
)1. pA 一 旦 发 现 相 同 单 词 ， 就 对 该 单词 的 出 现 次 数 加 
2 及 发 现 相同 单词 但 遍历 到 了 比 该 单词 “大 ”的 单词 〈 按 在 字典 中 
出 现 的 顺序 排列 时 ， 位 于 某 单词 之 后 的 单词 ) 时 ， 就 将 该 单词 插入 
到 更 “大 ”的 单词 的 前 面 。 


往 数 组 中 插入 单词 的 步骤 如 下 所 示 《〈 图 5-3) 。 


将 要 插入 单词 的 位 置 后 的 元 素 逐 一 向 后 移动 。 


咏 将 新 元 素 保存 到 空 出 来 的 位 置 中 。 





人 移动 后 方 元 素 …… 


ee 


图 5-3 问 数 组 插入 元 素 


这 里 有 一 个 问题 : 在 每 次 插入 单词 时 ， 都 必须 移动 数组 中 后 方 的 元 


另外 ， 数 组 的 元 素 个 数 需要 在 一 开始 就 确定 。 当 然 ， 正 如 4-1-3 
节 中 所 说 ， 也 可 以 在 动态 分 配 数 组 的 内 存 空间 之 后 ， 使 用 realloc() 
一 点 一 点 地 进行 扩展 ， 但 我 们 应 该 避免 频繁 地 使 用 realloc() 对 庞大 
的 内 存 空间 进行 扩展 (2-6-5 节 ) 。 


如 果 使 用 下 一 节 中 将 讲解 的 链表 ， 就 可 以 回避 这 些 问题 ”。 


”话说 回来 ， 数 组 也 并 非 一 无 是 处 。 对 已 经 排 好 序 的 数组 进行 查找 ， 速 度 会 快 得 惊 


一 一 这 就 是 数组 的 优点 。 对 此 ，5-1-5 节 中 将 进行 说 明 。 





数组 版 单词 管理 单元 如 代码 清单 5-7、 代 码 清单 5-8、 代 码 清单 
5-9 和 代码 清单 5-10 所 示 。 


代码 清单 5-7 initialize.c (数组 版 ) 


#include "word manage_p.h"” 

Word word_array[WORD_ NUM MAX]; 

int num_of_ word; 

丰收 兴 水 六 水 相 汕 守 玉 六 沙洲 汪 守 于 兴 米 洲 沙洲 六 罕 术 玉米 水 六 水 囊 六 六 六 水 六 水 淮 玉 来 玉 水 六 玉玲 玉 六 玉米 六 水 炒米 闵 当 洲 水 水 


* 初始 化 单词 管理 单元 


a tt de ee nt dt dd tt tt dh 




















void word initialize(void) 


{ 
} 


num of word = 0; 





\D ONTOOUUPAUWUDOP 
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代码 清单 5-8 add_word. c〔 数 组 版 ) 


















































#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include "word manage_p.h" 
/* 
* 将 位 于 index 后 方 的 元 素 〈 包 括 index) 逐一 后 移 
*/ 
static void shift array(int index) 
{ 
int src; /* 复制 源 的 索引 */ 
for (src = num of word - 1; src >= index; src--) { 
word array[src+1] = word array[src]; 
} 
num of word++; 
} 
/* 
* 复制 字符 串 
* 在 某 些 运行 环境 中 会 存在 strdup() 函 数 
* 但 标准 中 没有 strdup( ) 函数， 因此 这 里 需要 自制 
*/ 
static char *my_strdup(char *src) 
{ 
char *dest; 
dest = malloc(sizeof(char) * (strlen(src) + 1)); 
strcpy(dest, src); 
return dest; 
} 
六 米 术 米 米 洲 玉 闵 玉米 六 六 汕 玉 这 米 术 玉米 汕 水 玉米 术 米 六 六 玉 刷 六 术 闵 米 玉 来 飞 六 米 洲 洲 米 玉 汕 六 汗 米 玉米 术 洲 闵 刷 米 洒 米 


* 添加 单词 


六 六 六 米 六 六 米 宁 溃 六 六 六 六 米 宁 尺 六 六 六 水 玉 玉 六 六 六 六 玉米 玉米 水 兴 六 六 玉米 米 洲 省 玉米 米 玉 六 玉 半 六 玉米 玉米 米 六 六 省 玉环 六 


void add word(char *word) 


{ 
int i; 
int result; 


42 if (num of word >= WORD NUM MAX) { 

















43 /* 如 果 单 词 的 数量 超过 了 数组 的 元 素 个 数 ， 就 执行 异 第 终止 */ 
44 fprintf(stderr, "too many words.\n"); 

45 exit(1); 

46 } 

47 for (i = 8@; i «< num of word; i++) { 

48 result = strcmp(word array[i].name, word); 
49 if (result >= 0) 

50 break; 

51 } 

52 if (num of word != 6 && result == 6) { 

53 /* 发 现 了 相同 的 单词 */ 

54 word array[i].count++; 

55 } else { 

56 shift_ array(i); 

57 word array[i].name = my_strdup(word); 

58 word array[i].count = 1; 


代码 清单 5-9 ”dump_word. c (数组 版 ) 


#include <stdio.h> 
#include "word manage_p.h" 


yt et wi de ed td ei ht 
A 
* 对 单词 列表 进行 转 储 
玉 洲 六 米 水 水 米 玉 六 六 六 六 水 米 玉 玉米 六 六 六 米 米 玉米 江洲 洲 米 洲 米 米 水 玉 宁 米 术 米 米 闵 米 闵 术 米 米 闵 水 米 玉米 洲 米 洒水 米 闵 玉 术 了 
void dump word(FILE *fp) 

















i; 
for (i = 8@; i «< num of word; i++) { 


fprintf(fp, "%-20s%5d\n", 
word_ array[i].name, word array[i].count); 


代码 清单 5-10 finalize.c (数组 版 ) 





1 #include <stdlib.h> 
2 #include "word manage _p.h" 

3 

4 VA tobe de td 
5 * 执行 单词 管理 单元 的 结束 处 理 


6 ed tt dt dd A 


























7 void word finalize(void) 


int i; 


/* 释放 单词 所 占用 的 内 存 空间 */ 
for (i = 8; i < num of word; i++) { 
free(word _ array[i].name); 





} 


num_ of_ word = 6; 





5-1-4 ”链表 版 
在 上 一 节 中 ， 我 们 指出 了 数组 版 的 实现 中 存在 以 下 问题 。 
e 当 需 要 在 中 途 插入 元 素 时 ， 必 须 移 动 其 后 所 有 的 元 素 ， 效 率 差 


”当然 ， 在 删除 元 素 时 ， 如 果 想 将 空 出 来 的 位 置 填 满 ， 也 需要 移动 其 后 的 元 
素 。 虽 说 删除 时 设置 一 个 “删除 标志 ” 放 在 那儿 也 可 以 解决 此 问题 ， 但 这 毕竟 不 是 什 


么 正规 的 做 法 ， 如 果 能 不 用 还 是 不 要 用 。 上 毕竟 在 某 些 情况 下 ， 可 能 就 无 法 使 用 这 种 办 
法 解决 问题 了 。 





。 需要 在 一 开始 融 确 定 元 素 的 最 大 个 数 。 虽 然 可 以 使 用 
re 
用 此 方法 。 


对 于 这 些 问题 ， 可 以 使 用 称 为 链表 (1inked 1ist) 的 数据 结构 解 
决 。 


所 谓 链 表 ， 就 是 将 节点 这 一 组 成 部 分 通过 指针 以 锁链 状 连接 而 成 的 
数据 结构 (图 5-4) 。 


节点 
co 全 全 全 全 


加 入 NULD 表示 结尾 





图 5-4 链表 


为 了 通过 链表 管理 单词 ， 这 里 像 下 面 这 样 为 结构 体 Word 添加 了 指 
向 下 一 个 元 素 的 指针 next 。 


* 关于 该 声明 的 写法 ， 请 同时 参考 2-6-1 节 的 相关 内 容 。 


typedef struct Word tag { 
char *name; 
int count; 
struct Word tag *next; 
} Word; 





然后 就 可 以 通过 这 个 next 指向 下 一 个 元 素 了 。 


链表 版 的 word_manage_p. h 如 代码 清单 5-11 所 示 。 


代码 清单 5-11 word manage_p.h 〈 链 表 版 ) 





1 #ifndef NORD_MANAGE_P_H_INCLUDED 
2 #define WORD MANAGE P_H_INCLUDED 
3 

4 #include "word manage.h" 

5 


6 typedef struct Word tag { 


7 char *name; 
8 int count; 
9 struct Word tag *next; 
16 } Word; 

11 

12 extern Word *word header; 

13 


14 #endif /* WORD MANAGE P_H_INCLUDED */ 





对 于 链表 来 说 ， 只 要 后 续 还 有 内 存 ， 就 可 以 不 断 地 为 Word 分 配 内 
存 空 间 ， 从 而 扩展 链表 。 与 使 用 realloc() 扩展 数组 时 不 同 ， 扩 展 链 
表 不 需要 连续 的 内 存 空间 ， 因 此 也 不 存在 效率 极端 低下 的 问题 。 

另外 ， 链 表 的 插入 、 删 除 都 非常 方便 ， 这 也 是 它 的 一 个 优点 。 在 使 
用 数组 时 ， 插 入 元 素 时 必须 移动 所 有 位 于 插入 位 置 之 后 的 元 素 ， 而 在 使 
用 链表 时 ， 只 需 更 换 一 下 指针 就 万 事 大 吉 了 。 这 是 因为 ， 链 表 中 的 元 素 
无 须 在 内 存 中 按 顺 序 排列 。 


下 面 列举 几 种 针对 链表 的 基本 操作 。 
)1. 查找 
在 从 链表 中 查找 元 素 时 ， 需 要 按 顺序 遍历 指针 *。 


”如 下 代码 中 的 pos 是 position (位 置 ) 的 缩 略 写法 。 





/* 假设 header 中 保存 了 初始 元 素 */ 
for (pos = header; pos != NULL; pos = pos->next) { 


if (找到 了 目标 元 素 ) 


break ; 


} 
if (pos == NULL) { 

/* 未 找到 目标 元 素 时 的 处 理 
} else { 


/* 找到 了 目标 元 素 时 的 处 理 
































2 插入 


当知 道 指向 某 个 元 素 的 指针 pos 时 ， 可 以 通过 以 下 操作 在 该 
元 素 的 后 方 插入 元 素 new_item (图 5-5) 。 


new_item->next = pos->next; 
pos->next = new_ item; 





new_item 


5-5 “对 链表 添加 元 素 


当 pos 指向 最 后 一 个 元 素 时 ， 似 乎 需要 区 分 不 同情 况 ， 但 其 
实 使 用 这 种 方法 依旧 可 以 正确 地 向 链表 末尾 添加 元 素 。 


在 像 本 例 这 样 的 “ 单 向 ”链表 中 ， 当 知道 指向 茶 个 元 素 的 指针 
时 ， 我 们 无 法 在 该 元 素 的 前 方 插入 元 素 " 。 这 是 因为 在 单 向 链表 
中 ， 我 们 无 法 追溯 到 某 个 元 素 前 方 的 元 素 。 


”实际 上 ， 如 果 使 用 “向 pos 的 后 方 添加 元 素 ， 然 后 交换 它们 的 内 容 ” 这 一 技 
巧 ， 就 可 以 使 之 看 上 去 像 是 向 pos 的 前 方 添加 了 元 素 一 样 。 但 在 5 语言 中 ， 一 般 在 


构造 链表 时 数据 部 分 本 身 放 入 的 就 是 指针 ， 此 时 如 果 只 移动 内 容 ， 那 么 当 程序 的 某 处 
有 指针 指向 该 元 素 时 ， 就 会 比较 麻烦 ， 因 此 我 觉得 还 是 不 要 这 么 做 比较 稳妥 。 





)3. 删除 


当知 道 指向 某 个 元 素 的 指针 pos 时 ， 可 以 通过 以 下 操作 删除 
位 于 该 元 素 的 后 方 的 元 素 〈 图 5-6) 。 


temp = pos->next 
pos->next = pos->next->next,; 
free(temp); 














1 1 es 


temp 


5-6 ”从 链表 删除 元 素 


在 单 向 链表 中 ， 如 果 只 知道 指向 菏 个 元 素 的 指针 ， 是 无 法 删除 
该 元 素 本 身 的 "。 这 也 是 因为 在 单 向 链表 中 ， 我 们 无 法 追溯 到 某 个 
元 素 前 方 的 元 素 。 


”在 这 种 情况 下 ， 如 果 使 用 “将 pos 后 方 的 元 素 内 容 复制 到 pos 中 ， 然 后 删 


除 pos 后 方 的 元 素 ” 这 一 技巧 ， 其 实 是 可 以 将 该 元 素 删除 的 。 但 这 种 做 法 会 导致 链 
表 中 最 后 一 个 元 素 无 法 删除 。 





链表 版 单词 管理 单元 的 代码 如 代码 清单 5-12、 代 码 清单 5-13、 代 
码 清单 5-14 和 代码 清单 5-15 所 示 。 


代码 清单 5-12 initialize.c (链表 版 ) 





#include "word manage_p.h"” 


Word *word header = NULL; 


/不 洲 米 沙洲 六 六 六 水 米 洲 六 六 六 水 米 洲 米 洲 闪 来 玉 玉米 洲 当 六 及 六 洲 光 兴 深 米 洒 玉 玉米 洲 洲 米 采 六 术 六 六 当 米 六 洲 六 六 炒米 玉 


* 初始 化 单词 管理 单元 
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void word initialize(void) 
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word header = NULL 


代码 清单 5-13 add word. c 〈 链 表 版 ) 





#include “stdio.hy> 
#include <stdlib.h> 
#include <string.h> 
#include "word manage_p.h" 








* 复制 字符 串 
* 在 某 些 运行 环境 中 会 存在 strdup() 函 数 
* 但 标准 中 没有 strdup( ) 函 数 ， 因 此 这 里 需要 自 种 























Ws 

















A 
static char *my_strdup(char *src) 
{ 
char *dest; 
dest = malloc(sizeof(char) * (strlen(src) + 1)); 
strcpy(dest, src); 
return dest; 
} 
/* 
* 生成 新 的 Nord 结 构 体 
wh 
static Word *create word(char *name) 
{ 
Word *new word; 
new word = malloc(sizeof(Word)); 
new_word->name = my_strdup(name); 
new word->count = 1; 
new word->next = NULL; 
return new word; 
} 
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* 添加 单词 


tt sl de ed ea tt oA 


void add word(char *word) 























{ 
Word *pos; 
Word *prev; /* 指向 pos 前 一 个 元 素 的 指针 */ 
Word *new word; 
int result; 
prev = NULL; 
for (pos = word header; pos != NULL; pos = pos->next) { 
result = strcmp(pos->name, word); 
if (result >= 0) 
break; 
prev = pos; 
if (word header != NULL && result == 6) { 
/* 发 现 了 相同 的 单词 */ 
pos->count++; 
} else { 
new word = create word(word); 
if (prev == NULL) { 
/* 插入 到 链表 头 部 */ 
new_ word->next = word header; 
word header = new word; 
} else { 
new word->next = pos; 
prev->next = new_ word; 
} 
} 
} 


代码 清单 5-14 ”dump_word. c 〈 链 表 版 ) 





#include “stdio.hy> 
#include "word manage_p.h" 


pt et oo i et eo td 


* 对 单词 列表 进行 转 储 


dt et td ee ot cat tp 

















7 void dump word(FILE *fp) 


8 1 

9 Word *pos; 

16 

11 for (pos = word header; pos; pos = pos->next) { 
12 fprintf(fp, "%-20s%5d\n", 

13 pos->name, pos->count); 


代码 清单 5-15 ”finalize. c 《链表 版 ) 


1 #include <stdlib.h> 
2 #include "word manage _p.h" 
3 


4 A ed he et ted 


5 * 执行 单词 管理 单元 的 结束 处 理 


6 hs de i ts ht tt dh 












































7 void word finalize(void) 


Word *temp; 











/* 通过 free( ) 释 放 所 有 已 添加 的 单词 */ 
while (word header != NULL) { 

temp = word header; 

word header = word header->next; 








free(temp->name); 
free(temp); 





add_word() 采用 了 与 数组 版 相同 的 方针 : 从 头 开 始 按 顺序 遍历 链 
表 ， 当 遍历 到 了 比 该 单词 “大 ”的 单词 〈 按 在 字典 中 出 现 的 顺序 排列 
时 ， 位 于 茶 单 词 之 后 的 单词 ) 时 ， 融 将 该 单词 插入 到 更 “大 ”的 单词 的 
前 面 。 


由 于 在 单 向 链表 中 ， 在 发 现 比 该 单词 “大 ”的 单词 时 ， 无 法 在 其 前 
面 执行 插入 操作 ， 所 以 示例 程序 中 使 用 了 指针 prev， 该 指针 指向 pos 


的 前 一 个 元 素 。 

word finalize() 通过 free() 将 链表 中 的 元 素 全 都 释放 了 。 用 
一 句 话 来 概括 ， 就 是 “从 链表 的 初始 元 素 开 始 ， 将 元 素 一 个 一 个 地 切 
断 ， 然 后 通过 free() 释放 掉 ”。 


在 这 种 情况 下 ， 常 常 有 人 与 出 下 面 这 样 的 代码 。 


Word *pos; 
/* 从 头 开 始 按 顺 序 遍 历 链表 ， 然 后 〈 打 算 ) 通过 free() 释 放 */ 


for (pos = word header;i pos != NULL; pos = pos->next) { 























free(pos->name) 
free(pos ) ; 





这 段 代 码 是 错误 的 。 如 果 通 过 free() 将 pos 给 释放 掉 了 ， 那 这 
里 就 无 法 引用 pos->next 了 。 但 是 ， 根 据 环 境 和 状况 不 同 ， 这 样 的 程 
序 有 时 也 能 跑 起 来 ， 因 此 这 种 做 法 反而 会 使 情况 变 得 更 加 糟糕 〈2-6-4 
和 


补充 “ 头 文件 的 公有 和 私有 


关于 单词 的 出 现 频率 问题 中 的 单词 管理 单元 ， 我 们 编写 了 “数组 
版 ”与 “链表 版 ”两 种 程序 。 


但 单词 管理 单元 对 外 公开 的 头 文件 word_manage. h 连 一 个 字符 
都 没有 修改 。 因 此 ， 即 便 单 词 管理 单元 的 实现 方法 从 数组 变 为 了 链 
表 ， 使 用 它 的 那 一 方 (main. c) 也 不 需要 进行 任何 修改 ， 就 连 重 新 编 
译 的 必要 都 没有 【只 要 重新 链接 就 可 以 了 ) 。 


在 单词 管理 单元 中 ， 我 们 将 对 外 公开 的 头 文件 word_manage.h 
与 用 于 在 单词 管理 单元 内 部 共享 信息 的 头 文 件 word_manage_p.h 完 
全 分 离开 了 。 这 样 一 来 ， 不 论 怎么 修改 单词 管理 单元 内 部 的 实现 ， 都 
“会 对 使 用 方 产生 影响 。 


我 们 一 般 将 对 外 公开 的 头 文件 称 为 公有 头 文件 ， 而 将 用 于 在 内 部 
共享 信息 的 头 文件 称 为 私有 头 文 件 。 





由 于 私有 头 文件 的 内 部 大 多 会 使 用 公有 头 文件 中 提供 的 类 型 或 者 
宏 ， 所 以 私有 头 文件 在 多 数 情 况 下 会 #include 公有 头 文件 。 


但 是 ， 在 公有 头 文件 中 ， 不 论 是 直接 地 还 是 间接 地 ， 都 绝对 不 能 
#include 私有 头 文件 。 打 个 比方 ， 这 就 相当 于 : 虽然 一 家 公司 对 外 
公开 发 布 的 内 容 可 以 写 到 面向 公司 内 部 的 文件 中 ， 但 如 果 是 面向 公司 
内 部 的 《内 部 机 密 ) 文件 ， 则 其 内 容 绝对 不 可 以 写 到 对 外 公开 发 布 的 
宣传 资料 中 。 


只 要 遵守 这 一 方针 ， 私 有 头 文件 中 的 内 容 就 不 会 被 泄露 给 该 模块 
的 使 用 者 ， 这 样 就 可 以 将 大 型 程序 分 割 给 多 个 团队 进行 开发 了 。 


更 进一步 来 说 ， 在 大 型 项 目的 情况 下 ， 函 数 名 、 全 局 变量 名 、 写 
在 公有 头 文件 中 的 类 型 名 、 宏 名 就 需要 借助 命名 规则 来 避免 名 称 冲突 
“。 不 过 在 这 次 的 示例 程序 中 ， 我 们 并 没有 做 到 这 么 规范 。 


”在 Java、c# 和 C++ 这 样 能 够 控制 命名 空间 的 语言 中 ， 似 乎 就 没有 必要 依赖 命 
名 规则 了 ， 但 事实 上 ， 如 果 起 的 是 List 这 种 简单 的 名 称 ， 还 是 会 发 生 冲突 ， 而 在 Java 
的 Swing 中 也 需要 添加 J 作为 前 缀 ， 所 以 其 实 还 是 需要 遵守 命名 规则 的 。 


补充 。 当 需要 同时 处 理 多 个 数据 时 


在 现在 的 应 用 程序 (MS-Word 或 MS-Excel 等 ) 中 ， 同 时 打开 多 
个 文件 并 在 不 同 的 窗口 中 编辑 ， 这 是 再 普通 不 过 的 事情 了 。 


但 是 ， 在 这 次 的 单词 管理 单元 中 ， 不 论 是 数组 版 还 是 链表 版 ， 都 
把 数据 的 “根源 ”存放 在 了 全 局 变量 中 。 由 于 全 局 变量 在 同一 时 刻 只 
能 存在 一 个 ， 所 以 我 们 也 就 无 法 同时 处 理 多 个 数据 。 如 果 只 是 统计 单 
词 出 现 频率 的 程序 ， 可 能 这 样 也 没什么 关系 ， 但 一 般 来 说 ， 这 种 情况 
还 是 非常 令 人 头疼 的 。 


对 于 这 个 问题 ， 通 党 的 解决 办 法 是 将 保存 数据 的 “根源 ”的 部 分 





写成 结构 体 。 链 表 版 中 可 以 写成 下 面 这 样 。 


typedef struct { 
Word *word header:; 
} WordManager; 


然后 ， 在 word initialize() 中 ， 通 过 malloc() 分 配 新 的 
WordManager， 并 将 该 指针 通过 返回 值 返 回 ， 如 下 所 示 。 


WordManager *word initialize(void); 


接 下 来 ， 如 下 所 示 将 单词 管理 单元 的 其 他 函数 全 部 写成 “使 用 第 
1 个 参数 来 传递 指向 WordManager 的 指针 ”的 形式 。 


void add word(WordManager* word manager, char *word); 


void dump_ word(WordManager* word manager, FILE *fp); 
void word finalize(WordManager* word manager); 





这 样 一 来 ， 单 词 管 理 单元 的 使 用 者 就 可 以 通过 管理 多 个 
WordManager 来 同时 处 理 多 个 数据 了 。 

不 过 ， 由 于 WordManager 类 型 被 声明 在 了 公有 头 文件 中 ， 所 以 
Word 类 型 也 是 必需 的 ， 这 样 一 来 ，“ 使 用 了 链表 ”这 一 实现 细节 就 
会 被 泄露 给 使 用 者 。 

对 于 使 用 者 来 说 ， 所 需 的 只 有 指向 WordManager 的 指针 ， 并 不 
需要 知道 实现 细节 。 在 这 种 情况 下 ， 通 常 采用 在 公有 头 文件 中 声明 一 
个 不 完全 类 型 的 做 法 ， 如 下 所 示 。 


typedef struct WordManager tag WordManager; 


然后 ， 如 下 所 示 在 私有 头 文件 中 对 struct WordManager_tag 赋 
子 实 体 。 


struct WordManager tag { 
Word *word header:; 


}; 


这 样 就 可 以 避免 将 结构 体 的 内 容 暴 露 给 使 用 者 ， 实 现 让 使 用 者 仅 


使 用 指向 结构 体 的 指针 。 


补充 “迭代 咒 


在 这 次 的 word_count 程序 中 ， 我 们 将 用 于 输出 单词 使 用 频率 
列表 的 dump_word() 浮 数 包含 在 了 单词 管理 单元 中 。 虽然 在 某 些 情 
况 下 这 样 是 可 以 的 ， 全 遇 到 使 用 者 想 要 改变 
dump_word() 的 输出 格式 的 情 ) 


在 这 种 情况 下 ， 要 想 让 使 用 者 能 够 自己 通过 for 循环 自制 一 个 
相当 于 dump_word() 的 替代 品 ， 按 一 般 的 想法 ， 就 必须 将 数组 或 链 
表 这 样 的 单词 管 理 单元 内 部 的 数据 结构 暴露 给 使 用 者 。 


如 果 为 了 避免 直接 将 内 部 数据 和 暴露 出 来 ， 而 向 单词 管理 单元 添加 
了 像 下 面 这 样 的 “获取 第 n 个 单词 的 信息 ”的 函数 。 


/* 

* 返回 按 字 母 顺 序 排列 的 第 n 个 单词 

* 通过 返回 值 返回 该 单词 ， 将 出 现 次 数 保存 在 count 指 疝 的 地 址 
yh 


char *get nth_ word(int n, int *count); 




















姑且 不 论 数 组 ， 先 看 一 下 链表 中 的 情况 ， 要 想 获取 “第 n 个 元 
素 ”， 就 必须 从 头 开始 循环 ， 在 这 种 情况 下 ， 到 了 链表 中 后 面 的 部 
分 ， 程 序 的 性 能 就 会 大 幅 降低 。 


此 时 ， 也 可 以 考虑 准备 如 下 一 系列 函数 。 


/* 将 指向 单词 的 光标 移 到 链表 开头 */ 

void move to first word(void); 

/* 

* 返回 当前 光标 所 指 的 单词 ， 光 标 前 进 一 格 

* 在 对 最 后 一 个 单词 调用 完 该 函数 之 后 的 那 次 调用 中 ， 返 回 NULL 
Wh 


char *get next word(int *count); 






































有 了 这 些 函 数 以 后 ， 在 调用 方 就 可 以 像 下 面 这 样 使 用 。 





char *word; 
int count; 


move to first word(); 


while ((word = get next word(&count)) != NULL) { 
/* 使 用 word 和 count 执 行 处 理 */ 
} 

















可 能 在 有 些 情况 下 这 种 做 法 就 已 经 足以 满足 需求 了 ， 但 在 使 用 该 
方法 时 ， 指向 当前 单词 的 光标 需要 保存 在 日 词 省 理 单元 的 内 部 。 如 果 
将 它 保存 在 全 局 变量 或 文件 内 的 static 变量 中 ， 那 么 由 于 同一 时 
刻 只 能 保存 一 个 变量 ， 所 以 像 “ 藤 套 双 重 循 环 ， 匹 配 全 部 内 容 ” 这 样 
的 功 g 就 无 法 实现 了 ， 


对 此 ， 可 以 借助 迭代 器 〈iterator) 这 一 概念 来 解决 。 虽 然 迭 代 
器 相当 于 上 面 所 说 的 光标 ， 但 由 于 迭代 器 的 内 部 持 有 表明 当前 指向 哪 
个 单词 的 信息 ， 所 以 使 用 者 可 以 同时 使 用 多 个 迭代 器 。 


a 了 迭代 器 这 种 功能 ， 但 如 果 用 C 语言 
来 实现 ， 就 需 将 公有 头 文件 写成 下 面 这 文 样 。 














/* 通过 不 完全 类 型 提供 迭代 器 的 类 型 */ 
typedef struct WordIterator tag WordIterator; 





/* 获取 迭代 器 */ 
WordIterator *get word iterator(void ) ; 


/* 











* 返回 迭代 器 指向 的 单词 ， 迭 代 器 前 进一步 

* 在 最 后 一 个 单词 的 下 一 次 调用 时 ， 返 回 NULL 

*/ 

char *get next word(WordIterator *iterator, int *count); 
/* 释放 和 迭代 器 的 内 存 */ 


void free word iterator(WordIterator *iterator); 

















在 这 种 情况 下 ， 在 数组 版 中 则 需要 在 私有 头 文件 中 像 下 面 这 样 将 
当前 单词 的 下 标 * 保存 在 ee 结构 体 中 。 然 后 ， 在 
get_word iterator() 中 通过 malloc() 为 该 结构 体 分 配 空间 并 
返回 给 使 用 者 即 可 。 


struct WordIterator tag { 
int current word index; 


”由 于 这 种 类 型 〈Java 类 型 ) 的 迭代 器 指向 的 是 “元 素 与 元 素 之 间 ”， 所 以 准确 
来 说 ， 应 该 是 “ 接 下 来 要 返回 的 单词 的 下 标 ”。 





| 添加 查找 功能 

目前 的 word_count 只 是 用 来 读 入 文本 文件 并 对 统计 信息 进行 转 
储 ， 不 过 医 然 好 不 容易 收 和 并 统计 了 文本 文件 中 的 单词 出 现 频率 ， 不 妨 
再 实现 一 个 能 够 查找 该 单词 出 现 了 几 次 的 功能 


因此 ， 我 们 思考 一 下 如 何在 单词 管理 单元 中 添加 如 下 所 示 的 功能 





/* 返回 通过 word 指 定 的 单词 的 出 现 次 数 */ 





int get word count(char *word); 


最 简单 的 方法 就 是 从 头 开 始 按 顺序 遍历 那些 用 数组 或 者 链表 管理 的 
单词 ， 从 而 查找 目标 单词 ， 这 种 方法 称 为 线性 查找 (| inear 
search) 。 但 是 如 果 数 据 已 经 在 数组 中 排 好 了 序 ， 那 么 可 以 使 用 更 为 高 
效 的 查找 方法 ， 即 二 分 查找 (binary search) 

二 分 查找 的 步骤 如 下 所 示 。 
)1. 选择 位 于 数组 中 间 位 置 的 元 素 。 
)2. 如 果 该 元 素 

就 是 需要 查找 的 元 素 ， 结 束 查 找 ; 


GO 比 需 要 查找 的 元 素 小 ， 对 该 元 素 之 后 的 数组 重复 执行 相同 的 


_L 上 TBX 
步骤 ; 


G) 比 需要 查找 的 元 素 大 ， 对 该 元 素 之 前 的 数组 重复 执行 相同 的 


步骤 。 
我 们 在 查 词 典 时 使 用 的 就 是 与 此 类 似 的 方法 。 
get_word_count() 的 数组 版 的 实现 示例 如 代码 清单 5-16 所 


代码 清单 5-16 get word count.c 


1 #include <stdio.h> 

2 #include <string.h> 

3 #include "word manage _p.h" 

4 

5 yA i ts 
6 * 返回 某 个 单词 的 出 现 次 数 

7 ds ee ds i ks tt eh 
8 int get word count(char *word) 


9 1 

















int left = 0; 

int right = num of word - 1; 
int mid; 

int result; 


while (left <= right) { 
mid = (left + right) / 2; 
result = strcmp(word array[mid].name, word); 
if (result < 6) { 
left = mid + 1; 
} else if (result > 6) { 
right = mid - 1; 
} else { 
return word array[mid].count; 





不 过 ， 这 种 方法 只 在 查找 对 象 为 数组 的 情况 下 有 效 。 因 为 链表 无 法 
(快速 地 ) 搜寻 到 位 于 中 间 位 置 的 元 素 ， 所 以 不 能 使 用 二 分 查找 。 


没有 哪个 数据 结构 是 万 能 的 ， 它 们 各 有 各 的 优点 和 缺点 。 对 于 我 们 
来 说 ， 重 要 的 是 根据 实际 情况 选择 合适 的 数据 结构 。 


例如 ， 在 单个 元 素 较 大 的 情况 下 ， 就 可 以 考虑 使 用 指针 的 可 变 长 数 
组 这 种 方法 (图 5-7) 。 


利用 realloc () 
扩展 指针 的 数组 


图 5-7 使 用 指向 元 素 的 指针 的 数组 


在 使 用 这 种 方法 时 ， 即使 单个 元 素 很 大 ， 指 针 数 组 的 内 存 空间 本 身 
也 不 会 变 大 ， 因 此 我 们 或 许可 以 通过 realloc() 一 点 一 点 地 使 数组 得 
以 扩展 *。 而 且 ， 使 用 这 种 方法 ， 还 可 以 在 查找 时 使 用 二 分 查找 法 。 


”当然 ， 如 果 元 素 个 数 非常 多 ， 那 么 就 算 只 是 使 用 realloc() 扩展 指针 数组 的 内 存 
空间 ， 也 可 能 导致 内 存 不 足 。 


补充 翻 倍 游 戏 
如 果 数 据 量 比较 少 ， 那 么 不 论 是 使 用 线性 查找 还 是 使 用 二 分 查 


找 ， 在 效率 上 并 不 会 出 现 太 大 的 差别 。 但 是 ， 随 着 数据 量 的 增加 ， 二 
分 查找 在 速度 上 就 会 呈现 出 压倒 性 的 优势 。 


对 此 ， 可 能 有 人 会 产生 下 面 这 样 的 想法 。 





真 的 吗 ? 二 分 查找 会 使 程序 变 复杂 ， 从 而 导致 运行 速度 下 降 ， 
这 一 点 跟 自身 优势 相互 抵消 之 后 ， 二 分 查找 与 线性 查找 其 实 也 没有 
太 大 差别 吧 ? 


就 线性 查找 来 说 ， 随 着 数据 量 的 增加 ， 其 所 需 的 查找 时 间 会 成 比 
例 增 加 。 但 是 ， 就 二 分 查找 来 说 ， 即 使 数据 量 翻 倍 ， 查 找 次 数 也 只 会 
增加 1 次 。 这 就 意味 着 ， 即 使 数据 量 大 到 不 现实 的 程度 ， 也 可 以 在 
极 短 的 时 间 内 完成 查找 。 


为 了 让 大 家 更 加 直观 地 体会 这 一 点 ， 这 里 打 个 比方 。 


假设 有 一 张 报 纸 ， 它 的 厚度 是 0. 1 mm。 将 报纸 对 折 ， 厚 度 变 为 
0.2 mm。 有 再 次 对 折 ， 则 变 为 0. 4 mm。 


那么 ， 对 折 100 次 之 后 ， 厚 度 会 是 多 少 呢 ? 


当然 ， 实 际 上 是 折 不 了 那么 多 次 的 ， 当 折 不 了 的 时 候 ， 束 把 它 切 
成 两 份 压 起 来 也 可 以 。 总 之 ， 在 重复 了 100 次 数学 上 的 “厚度 翻 
倍 ” 之 后 ， 最 终 的 厚度 会 变 成 多 少 呢 ? 


1 m 左右 ? 不 对 不 对 ， 完 全 不 对 。 答 案 是 大 约 134 亿 光 年 。 如 
果 你 觉得 这 是 信口开河 ， 就 用 手边 的 计算 器 计算 一 下 吧 〈1 光 年 算 作 
94 600 000 000 000 km) 。 

也 就 是 说 ， 在 使 用 二 分 查找 的 情况 下 ， 对 “134 亿 光 年 / 0.1 


mm ”个 数据 ， 只 需 循环 100 次 就 可 以 完成 查找 。 如 果 对 相同 数量 的 
数据 使 用 线性 查找 …… 唉 ， 在 我 有 生 之 年 恐怕 是 看 不 到 结果 了 ”。 


”所 以 ， 对 于 哆 啦 A 梦 的 那些 道具 ， 我 觉得 最 吓人 的 并 不 是 “地 球 毁 灭 炸 
弹 ”〈《 球 虫 漫画 》 第 7 卷 ) ， 而 是 “ 倍 倍 液 ”《〈《 甄 虫 漫画 》 第 17 卷 ) 《哈哈 ) 。 





5-1-6 其 他 数据 结构 
其 他 的 数据 结构 有 下 面 这 些 。 
国 双 问 链表 
前 面 提 到 的 链表 指 的 都 是 单 向 链表 。 
单 向 链表 不 能 “ 回 滴 ”， 因 此 它 具 有 以 下 缺点 。 
)1.， 在 向 链表 添加 元 素 时 ， 必 须知 道 位 于 添加 位 置 之 前 的 元 素 。 
)2. 在 从 链表 删除 元 素 时 ， 必 须知 道 位 于 要 被 删除 的 元 素 之 前 的 元 素 。 
)3， 不 能 〈 简 单 地 ) 实现 逆向 遍历 链表 。 


如 果 使 用 双向 链表 (doubly linked 1ist) ， 就 可 以 解决 这 些 问 题 
(图 5-8) 。 


we ST ST Ss 了 


图 5-8 双向 链表 
用 5 语言 编写 的 结构 体 如 下 所 示 。 


typedef struct Node tag { 
/* Node 特 有 的 数据 */ 
struct Node tag *prev; /* 指向 前 面 元 素 的 指针 */ 





struct Node tag *next; /* 指向 后 面 元 素 的 指针 */ 
} Node; 





但 是 ， 双 向 链表 也 有 缺点 ， 如 下 所 示 。 


)1. 每 个 元 素 都 需要 两 个 指针 ， 因 此 会 额外 地 消耗 内 存 。 
)2. 需要 操作 的 指针 太 多 ， 因 此 编码 时 容易 引入 Bug。 


四 树 形 结构 
比如 ，Windows 或 Macintosh 的 文件 夹 是 分 层 结 构 的 。 这 样 的 数 


据 结 构 在 外 形 上 与 倒 过 来 的 树木 很 相似 ， 因 此 被 称 为 树 〈tree) 图 
9) a 


树 中 的 各 个 元 素 称 为 节点 We 。 最 根部 的 节点 称 为 根 节点 
(root) 。 当 某 节 点 A 为 某 节点 B 的 下 层 节点 上 时， 我 们 称 A 为 B 的 
于 节点 Cehi ld) ，B 为 A 的 父 节 点 (parent) 。 例如 ， 在 图 5-9 
中 ，Node5 是 Node2 的 子 节点 ，Node2 是 Node5 的 父 节 上 点。 连接 父 节 
点 与 子 节点 的 线 称 为 分 支 (branch) 。 


根 节点 





Node11 


图 5-9 树 


人 0 语言 表示 树 时 ， 典 型 的 做 法 是 使 用 下 面 这 样 的 结构 体 〈 图 
5-10) 。 


typedef struct Node tag { 
/* 该 程序 特有 的 数据 */ 
int nchildren; /* 子 节点 的 个 数 */ 








struct Node tag **child; /* 该 指针 指向 通过 malloc() 分 配 的 指 癌 
子 节点 的 指针 的 可 变 长 数组 */ 








} Node 









通过 malloc () 分 配 的 指向 
子 节 点 的 指针 的 可 变 长 数组 


图 5-10 用 C 语言 表示 树 形 结构 


每 个 节点 最 多 只 能 有 两 个 子 节点 的 树 称 为 二 叉 树 binary 
tree) *。 


”提问 : 每 个 节点 最 多 只 能 有 一 个 子 节点 的 树 叫 作 什么 ? 一 一 答案 是 “链表 ”。 





这 次 的 word_count 也 可 以 使 用 运用 了 二 叉 树 的 二 又 查 找 树 
(binary search tree) 这 一 数据 结构 。 


所 谓 二 又 查找 树 ， 指 的 是 所 有 节点 都 满足 以 下 条 件 的 二 叉 树 (图 
5 


)1. 对 于 节点 p，p 左边 的 子 树 小 于 p。 
)2. 对 于 节点 p，p 右边 的 子 树 大 于 p。 


假设 这 是 p 


位 于 这 一 侧 的 节点 小 于 p 位 于 这 一 侧 的 节点 大 于 p 


图 5-11 二 又 查找 树 
在 创建 了 二 叉 查 找 树 之 后 ， 可 以 按 以 下 方式 插入 元 素 或 查找 元 素 。 
)1. 插入 


从 根 节点 开始 按 顺 序 遍 历 ， 如 果 要 插入 的 元 素 小 于 当前 元 素 ， 
则 向 左 继 续 遍 历 ; 如 果 要 插入 的 元 素 大 于 当前 元 素 ， 则 向 右 继续 遍 


历 。 当 到 达 相 等 节点 或 NULL 时 ， 将 节点 插入 到 该 位 置 。 
)2. 查找 


从 根 节 点 开始 按 顺 序 遍 历 ， 如 果 要 查找 的 元 素 小 于 当前 元 素 ， 
则 向 左 继续 遍历 ; 如 果 要 插入 的 元 素 大 于 当前 元 素 ， 则 向 右 继续 遍 
历 。 2 则 查找 结束 。 到 达 NULL 则 说 明 树 中 无 
该 元 素 。 


如 果 使 用 这 种 方法 ， 那 么 只 要 二 叉 树 是 以 理想 的 形式 创建 的 ， 就 能 
够 实现 高 速 的 插入 和 查找 。 但 在 最 坏 的 情况 下 例如 对 word_count 
按 字典 顺序 输入 单词 的 情况 ) ， 它 就 会 变 成 单纯 的 链表 。 


单纯 的 二 又 查找 树 根 据 情况 不 同 在 效率 上 会 有 天 差 地 别 ， 而 且 很 容 


易 引 起 最 糟糕 的 情况 ”"， 因 此 现实 中 单纯 的 二 叉 树 并 不 实用 。 为 了 避免 
这 一 缺点 ， 人 们 研究 出 了 AVL 树 、 红 黑 树 等 算法 。 


| 





国 [ 合 希 


当 需 要 管理 大 量 数据 (假设 这 些 数 据 是 记录 在 卡片 上 的 ) 时 ， 你 会 
怎么 做 昵 ? 如 果 还 需要 频繁 地 对 元 素 进行 添加 、 删 除 和 查找 等 操作 呢 ? 


做 事 严谨 的 人 大 概 会 使 卡片 常年 保持 在 排 好 序 的 状态 ， 这 样 就 可 以 
使 用 二 分 查找 法 进行 查找 ， 效 率 会 很 高 。 但 是 如 果 卡 片 的 插入 操作 很 费 
dt i ， 那 么 在 保持 有 序 的 状态 下 添加 元 素 是 很 


做 事 懒 散 的 人 可 能 会 将 卡片 一 股 脑 儿 地 扔 进 一 个 箱子 里 ， 当 需要 执 
行 查找 时 ， 就 从 头 开始 一 张 一 张 地 进行 查找 。 如 果 使 用 这 种 做 法 ， 添 加 
卡片 会 比较 简单 ， 但 查找 起 来 就 相当 耗 时 了 。 


而 如 果 是 既 严 谨 又 怕 麻 烦 的 人 ， 那 么 他 应 该 会 将 卡片 分 门 别 类 ， 然 
后 分 别 闭 入 到 不 同 的 箱子 中 。 


所 谓 哈 希 〈hash) ， 就 是 基于 上 面 的 第 3 种 想法 的 数据 结构 。 


在 叫 作 哈 希 表 (hash table) 的 数组 中 将 元 素 以 链表 形式 保存 的 外 
链 哈 希 ” 就 是 一 种 典型 的 哈 希 结构 (图 5-12) 。 


” 除 此 以 外 ， 还 有 完全 哈 希 、 开 放 地 址 法 (open addressing) 等 。 





哈 希 表 


图 5-12 ”外 链 哈 希 


哈 希 函数 用 于 决定 存放 某 个 元 素 的 哈 希 表 的 下 标 。 我 们 希望 哈 希 函 
数 能 够 基于 查找 用 的 关键 字 (比如 对 于 word_count 中 的 
get_word_count() 来 说 ， 关 键 字 就 是 单词 的 字符 串 ) ， 返 回 尽 可 能 
分 散 的 值 。 在 以 字符 串 作 为 关键 字 时 ， 经 常 使 用 “将 各 个 字符 按 位 移 位 
之 后 相 加 ， 再 除 以 哈 希 表 的 元 素 个 数 之 后 取 余 数 ” 这 种 算法 。 如 果 运 气 
不 佳 遇 到 了 哈 希 函数 对 不 同 的 关键 字 返 回 了 相同 的 值 的 情况 ， 那 么 这 些 
关键 字 就 被 称 为 同义词 (synonym) 。 

在 查找 元 素 时 ， 要 先 通 过 查找 关键 字 求 得 哈 希 表 的 下 标 ， 再 从 关联 
在 该 下 标 上 的 链表 中 查找 元 素 。 如 果 哈 希 函 数 能 够 尽 可 能 地 返回 均等 的 
人 因此 查找 的 速度 就 能 够 相应 地 
AE[S]o 

在 编译 器 的 标识 符 管 理 ， 以 及 Per1、Python、Ruby 和 
JavaScr ipt 等 语言 的 关联 数组 * 的 实现 中 ， 经 常 使 用 哈 希 表 *。 


”所 谓 关 联 数组 ， 就 是 元 素 下 标 既 可 以 使 用 整数 又 可 以 使 用 字符 串 〈 等 ) 的 数组 。 


”Per| 从 Ver.5 开始 将 “关联 数组 ”改称 为 “ 哈 希 ”， 不 过 对 于 特意 将 这 种 内 部 实 
现 手 法 展现 出 来 的 做 法 ， 我 有 点 难以 理解 。 





5-2 ”案例 学 习 2: 绘图 工具 的 数据 结构 


5-2-1 案例 的 需求 


这 次 我 们 尝试 编写 一 个 更 有 实践 意义 的 绘图 工具 ， 如 图 5-13 所 
， 假 设 该 程序 的 名 称 为 X-Draw。 





加 X-Draw 口 xX 


«| N\AOOnle le 
® © 











图 5-13 ”绘画 工具 X-Draw 的 界面 


假设 X-Draw 可 以 处 理 以 下 图 形 *。 


”这 个 绘图 工具 相当 简陋 ， 不 过 我 们 只 是 拿 它 当 例 题 练 手 的 ， 所 以 简陋 一 点 也 无 妨 。 





。 直线 。 绘 制 完 成 后 选择 “直线 变形 ”， 可 以 将 直线 改 成 折线 。 
。 长 方形 (不 考虑 相对 坐标 轴 呈 倾斜 状 的 长 方形 ) 。 可 填充 。 
。 椭 圆 (不 考虑 圆 激 ) 。 可 填充 。 


,。 限于 篇 咕 ， 本 书 没有 提供 整个 程序 ， 毕 这 窗口 系统 非常 依赖 运行 环 
兄 。 
里 将 只 说 明 X-Draw 的 数据 结构 的 头 文件 。 


完整 的 X-Draw 程序 (适用 于 Windows 环境 ) 可 以 从 下 面 的 图 灵 
社区 本 主页 ”下载 。 


本 


”请 至 “ 随 书 下 载 ” 处 下 载 X-Draw 程序 。 





5-2-2 ”表示 各 种 图 形 
我 们 先 来 考虑 一 下 怎样 表示 直线 、 折 线 、 长 方形 和 椭圆 这 些 图 形 。 


首先 ， 因 为 直线 就 是 只 有 两 个 顶点 的 折线 ， 所 以 可 以 通过 折线 表 
示 。 拖 忠 直 线 可 以 增加 顶点 ， 所 以 可 以 从 一 开始 就 把 直线 当 作 折线 处 
理 。 


关于 折线 ， 我 们 已 经 在 第 4 章 中 讨论 过 了 ， 这 里 不 再 准 述 。 


typedef struct { 


double x; 
double y; 
} Point; 


typedef struct { 
int npoints; 
Point *point; 
} Polyline; 





长 方形 〈Rectangle) 可 以 通过 代表 对 角 线 的 两 个 点 表示 ， 如 下 所 
未 。 


typedef struct { 
Point min_point; /* 左下 和 角 的 坐标 */ 
Point max_point; /* 右上 和 角 的 坐标 */ 
} Rectangle; 





























椭圆 (El1lipse〉 可 以 通过 圆心 与 横向 半径 、 纵 向 半径 表示 ， 如 下 
所 示 。 


typedef struct { 
Point center; /* 圆心 */ 
double h_radius; /* 横向 半 
double v_radius; /* 纵向 半 
} Ellipse; 








补充 关于 坐标 系 
能 有 人 会 产生 下 面 这 样 的 想法 。 


阵 ? 坐标 值 怎 么 全 都 是 double 的 ? 


既然 最 终 用 于 绘图 的 画面 是 用 像素 表示 的 ， 那 不 是 应 该 用 
int 类 型 来 保存 坐标 吗 ? 





的 确 ， 不 论 是 Windows 的 C AP1， 还 是 作为 UNIX 窗口 系统 的 
X Window System 的 图 形 库 Xl ib， 又 或 者 是 Java 的 AWT 等 ， 绘 图 
坐标 都 是 以 像素 为 单位 的 整数 。 


但 是 ， 这 并 不 意味 着 连 内 部 保存 的 数据 都 应 该 是 int。 假 设 程 

序 内 部 也 是 使 用 以 像素 为 单位 的 整数 值 来 保存 坐标 的 ， 那 么 首先 会 遇 
到 的 问题 就 是 ， 当 需要 放大 时 该 怎么 做 才 好 ? 如 果 只 能 放大 200%、 

300% 这 样 的 整数 倍 ， 就 会 很 不 方便 。 另 外 ， 在 放大 的 状态 下 绘制 新 
的 图 形 时 ， 用 户 应 该 会 期 待 画 出 的 图 形 更 加 精细 ， 但 由 于 坐标 是 用 整 
数值 表示 的 ， 所 以 我 们 无 法 实现 这 样 的 需求 。 另 外 ， 如 果 先 绘制 一 些 
稍微 复杂 一 点 的 图 形 ， 然 后 将 它们 组 合 起 来 ， 再 通过 控制 项 点 将 其 缩 
小 、 再 放大 ， 那 么 图 形 恐 怕 就 会 变 得 乱七八糟 。 






| * 我 就 见 过 这 样 的 绘图 工具 。 


其 实 ， 之 所 以 用 并 不 那么 细致 的 ) 像素 表示 图 像 ， 说 到 底 是 由 
显示 设备 自身 的 条 件 造成 的 。 所 以 在 使 用 绘图 工具 时 ， 并 不 是 用 户 
自己 想 要 使 用 像素 来 绘制 和 显示 图 形 的 。 


| ”虽然 绘图 工具 也 并 不 全 都 是 这 样 的 。 






因此 ， 对 于 绘图 工具 来 说 ， 先 假定 逻辑 上 的 用 户 坐 标 系 "， 然 后 
仅 在 显示 时 将 其 转换 成 设备 坐标 系 的 思路 才 是 正确 的 (图 5-14) 。 


| ”也 称 为 世界 坐标 系 或 逻辑 坐标 系 。 


设备 坐标 系 


人 ER 
图 5-14 坐标 系 转 换 
用 户 坐 标 系 中 没有 像素 这 一 源 于 设备 自身 条 件 的 限制 ， 所 以 坐标 
可 以 使 用 double 类 型 <。 另外 ， 设 备 坐标 系 大 多 以 左上 和 角 为 原点 ， 而 


用 户 坐 标 系 则 与 数学 上 的 坐标 轴 相 吻合 ， 我 认为 取 左 下 角 为 原点 似乎 
更 方便 一 些 〈 当 然 ， 实 际 还 是 需要 根据 用 途 而 定 ) 。 


”其 实 使 用 float 也 可 以 ， 只 不 过 由 于 6 语言 中 浮 点 数 基本 都 会 变 成 double， 
所 以 如 果 内 存 充 足 ， 还 是 应 该 使 用 double。 


用 户 坐 标 系 与 设备 坐标 系 之 间 的 转换 可 以 通过 乘法 与 减法 运算 轻 
松 实现 。 


* 不 过 更 普遍 的 做 法 是 使 用 矩阵 。 


另外 ， 我 们 还 可 以 在 Windows 中 定义 独立 于 设备 坐标 系 的 逻辑 坐 
标 系 ， 从 而 实现 以 毫米 为 单位 绘图 。 但 是 ， 它 的 坐标 值 的 类 型 却 
是 short int。 这 种 设计 思路 实在 是 超出 了 我 的 理解 能 





5-2-3 Shape 类 型 


上 一 节 我 们 讨论 了 各 种 图 形 的 表示 方法 ， 绘 图 工具 需要 对 各 式 各 样 
的 图 形 进行 许多 管理 工作 。 


这 里 ， 我 们 尝试 通过 Shape 这 个 结构 体 表示 单个 图 形 。 
Shape 中 应 该 包含 哪些 成 员 呢 ? 


首先 ， 图 形 是 有 颜色 的 。 颜 色 可 以 通过 混合 红 、 绿 、 蓝 三 原色 来 表 
示 ， 所 以 这 里 可 以 定义 一 个 Color 结构 体 ， 用 来 保存 颜色 。 


typedef struct { 


int red; 

int green; 

int blue; 
} Color; 





男 外 ， 图 形 又 分 为 有 填充 和 无 填充 两 种 情况 ， 所 以 还 需要 定义 一 个 
表示 填充 状态 的 枚 举 类 型 。 


typedef enum { 
FILL_ NONE, 












































FILL_ SOLID 
} FillpPattern; 





如 果 只 需 表 示 填 充 或 是 个 填充 ， 或 许 设置 一 个 标志 就 可 以 了 ， 但 考 
虑 到 将 来 需要 增加 填充 各 种 斜 线 花 纹 的 功能 ， 这 里 使 用 了 枚 举 类 型 。 


另外 ， 使 用 绘图 工具 生成 的 图 形 的 数量 在 一 开始 是 无 法 预测 的 ， 因 
此 比较 好 的 做 法 是 使 用 malloc() 来 动态 分 配 Shape 结构 体 ， 并 使 用 
链表 进行 管理 。 链 表 分 为 单 向 和 双向 ， 不 过 考虑 到 以 下 情况 ， 这 里 应 该 
选择 双向 链表 。 


。 图形 具有 上 下 关系 ， 后 画 的 图 形 显示 在 上 层 。 该 功能 的 实现 方式 
为 : 将 后 画 的 图 形 添 加 到 链表 的 末尾 ， 当 需要 重 画 全 部 图 形 时 ， 从 
链表 的 开头 开始 绘制 。 

。 当 需 要 用 电 标 单 击 选择 图 形 时 ， 必 须 优先 选择 显示 在 最 上 层 的 图 
形 。 该 功能 的 实现 方式 为 : 从 链表 的 末尾 开始 查找 ， 用 数学 方法 计 


算出 与 单 击 的 坐标 之 间 的 距离 。 


由 于 绘图 时 需要 从 链表 的 开头 开始 绘制 ， 而 单 击 选择 图 形 时 需要 从 
链表 的 末尾 开始 查找 ， 所 以 需要 使 用 双向 链表 。 


另外 ， 在 绘图 工具 中 ， 可 以 通过 单 击 并 拖 动 鼠标 框 住 图 形 的 方式 ， 
使 图 形变 为 选中 状态 。 这 里 给 Shape 结构 体 增加 一 个 selected 成 
员 ， 用 来 表示 该 图 形 已 被 选中 。 虽 然 在 5 语言 中 ， 可 以 把 selected 
的 类 型 定义 为 int， 用 0 表示 未 选中 状态 ， 用 1 表示 选中 状态 ， 不 过 
为 了 便于 理解 ， 这 里 我 们 把 它 定 义 为 枚 举 的 Boolean 型 。 


typedef enum { 
FALSE = 6， 


TRUE = 1 
} Boolean; 





Shape 可 能 是 折线 ， 也 可 能 是 长 方形 或 椭圆 ， 此 时 5 语言 的 惯用 
做 法 是 使 用 枚 举 和 联合 体 来 表示 它 。 





/* 用 于 表示 图 形 种 类 的 枚 举 类 型 */ 

typedef enum { 
POLYLINE_SHAPE, 
RECTANGLE_SHAPE ， 
ELLIPSE_SHAPE 

} ShapeType 





typedef struct Shape tag { 
/* 图 形 的 种 类 */ 
ShapeType type; 
/* 画笔 《轮廓 ) 的 颜色 */ 
Color line color; 
/* 填充 样式 。FILL_NONE 表 示 不 填充 */ 
FillpPattern fill pattern 
/* 有 填充 时 的 颜色 */ 





























Color fill color; 

/* 表示 是 否 被 选中 的 标志 */ 

Boolean selected; 

union { 
Polyline polyline; 
Rectangle rectangle; 
Ellipse ellipse; 

} yu; 


struct Shape tag *prev; 


struct Shape tag *next; 
} Shape; 


ShapeType 是 用 于 区 别 Shape 种 类 的 枚 举 类 型 。 我 们 可 以 通过 
Shape 的 type 成 员 识别 Shape 的 种 类 。 另 外 ， 图 形 种 类 所 对 应 的 信 
息 保存 在 联合 体 中 。 比 如 ， 当 type 为 ELLIPSE_SHAPE 时 ， 可 以 通 
过 shape->u.ellipse.center 引用 椭圆 的 圆心 坐标 。 


说 到 联合 体 ， 许 多 人 说 它 是 5 语言 的 功能 中 用 途 最 不 明确 的 。 在 
实际 的 程序 中 ， 其 用 途 通 常 是 “与 枚 举 组 合 使 用 ， 在 一 个 结构 体 中 存放 
各 种 不 同 种 类 的 数据 ”。 


绘制 所 有 图 形 的 程序 大 致 如 下 所 示 。 在 这 个 例子 中 ， 指 向 Shape 
的 链表 中 的 初始 元 素 的 指针 保存 在 head 变量 中 。 


Shape *pos; 


for (pos = head; pos != NULL; pos = pos->next) { 
switch (pos->type) { 
case POLYLINE SHAPE: 
/* 调用 绘制 折线 的 函数 */ 
draw_polyline(pos ) ; 
break ; 
case RECTANGLE SHAPE: 
/* 调用 绘制 长 方形 的 函数 */ 




















draw_rectangle(pos); 
break; 

case ELLIPSE SHAPE: 
/* 调用 绘制 椭圆 的 函数 */ 
draw_ellipse(pos); 
break; 

default: 


assert(0); 
} 





} 


因为 我 们 是 从 链表 的 开头 开始 按 顺 序 绘制 图 形 的 ， 所 以 位 于 链表 后 
方 的 图 形 会 显示 在 上 层 。 


大 多 数 绘图 工具 可 以 通过 单 击 选 择 图 形 ， 然 后 将 图 形 移动 到 顶层 或 
底层 。 在 这 种 情况 下 ， 需 要 使 选中 的 图 形 能 够 在 链表 中 移动 ， 这 时 可 以 
通过 将 其 插入 到 链表 末尾 使 其 移动 到 顶层 ， 或 将 其 插入 到 链表 开头 使 其 


移动 到 底层 。 
能 够 像 这 样 轻 松 地 实现 图 形 的 移动 ， 正 是 链表 的 强大 之 处 。 
5-2-4 讨论 一 一 还 有 其 他 方法 吗 


虽然 前 面 的 方法 好 像 也 都 还 不 错 ， 但 这 里 我 们 还 想 讨论 一 下 有 没有 
更 好 的 实现 方案 。 


或 许 有 人 会 产生 下 面 这 样 的 想法 。 





如 果 折 线 有 增加 和 删除 顶点 的 功能 ， 那 么 对 于 折线 ， 难 道 不 是 应 
该 使 用 链表 ， 而 不 是 Point 的 动态 数组 来 表示 吗 ? 


在 添加 顶点 时 ， 要 在 顶点 与 顶点 之 间 插 入 新 的 顶点 ， 那 么 难道 链 
表 的 插入 操作 不 应 该 比 数组 的 更 加 简单 吗 ? 





这 个 问题 太 难 了 ， 很 难说 到 底 怎样 做 才 是 正确 的 。 
但 是 ，Point 类 型 是 一 种 只 有 两 个 double 元 素 的 相对 较 小 的 类 


型 。 绘 图 工具 也 可 以 知道 折线 顶点 的 数量 。 因 此 ， 我 认为 由 于 Point 
的 数组 并 不 会 很 上 庞大， 所 以 即便 添加 项 点 时 利用 realloc() 一 点 一 点 


地 扩展 内 存 空间 ， 或 者 为 了 插入 元 素 而 将 后 面 的 元 素 全 部 移动 一 遍 ， 也 
都 不 是 什么 大 事 。 反 倒是 为 了 使 用 链表 而 向 成 员 中 添加 指针 ， 或 者 通过 
malloc() 为 每 个 Point 预 留 管理 空间 的 做 法 才 是 一 种 浪费 。 


如 果 在 意 malloc() 的 管理 空间 ， 那 么 对 Polyline 类 型 使 用 


可 变 长 结构 体 不 是 更 好 吗 ? 





原来 如 此 ， 使 用 4-2-10 节 或 者 4-2-11 节 (如 果 是 C99) 介绍 的 
技术 ， 就 无 顷 针 对 Point 的 数组 重新 调用 malloc() 了 。 然 而 ， 由 于 


polyline 不 是 结构 体 Shape 中 的 最 后 一 个 成 员 ， 所 以 这 里 不 能 使 用 
这 些 技术 。 


有 人 可 能 会 想 ， 把 Shape 结构 体 的 成 员 的 顺序 换 一 下 就 好 了 。 话 
哩 如 此 ， 但 如 果 这 么 做 ， 只 要 折线 的 项 点 数量 发 生 了 变化 ， 就 必须 针对 
每 个 Shape 执行 realloc()， 因 此 该 Shape 的 地 址 就 (有 可 能 ) 会 
发 生变 化 。 由 于 Shape 是 双向 链表 ， 前 后 两 个 Shape 都 会 指向 它 ， 
a 这 些 指针 也 必须 同时 改写 。 这 太 麻 烦 了 ， 而 且 很 容 
引发 Bug。 


虽然 这 里 使 用 了 联合 体 ， 不 过 联合 体 是 根据 成 员 中 最 大 的 成 员 的 


大 小 来 获取 内 存 的 。 这 有 点 浪费 吧 ? 





事实 的 确 如 此 ， 不 过 这 次 的 Polyline、Rectangle 和 Ellipse 
的 大 小 在 大 多 数 环境 中 是 差不多 的 。 


如 果 这 些 类 型 的 大 小 相差 很 大 ， 以 至 于 无 法 忽略 以 最 大 值 取 内 存 时 
造成 的 内 存 浪费 ， 则 最 好 使 用 “指针 的 联合 体 ”“。 然 后 ， 使 用 
malloc() 另行 分 配 Polyline、Rectangle 和 Ellipse 的 内 存 空 
间 。 


”虽然 此 时 使 用 void* 也 可 以 ， 但 这 样 一 来 ， 就 会 完全 搞 不 清 指 针 可 能 指向 什么 类 
型 。 因 此 ， 考 虑 到 代码 的 可 读 性 ， 这 里 最 好 使 用 指针 的 联合 体 。 





typedef struct Shape tag { 


union { 
Polyline *polylineje---- (本 行 及 以 下 2 行 ) 指针 的 联合 体 
Rectangle *rectangle; 
Ellipse *ellipse; 

} yu; 

struct Shape tag *prev; 

struct Shape tag *next; 


} Shape; 


在 这 种 情况 下 ， 前 面 关于 对 Polyline 类 型 使 用 可 变 长 结构 体 的 
想法 也 成 了 现实 可 行 的 方案 。 


但 正如 前 面 所 说 ， 这 里 的 Polyline、Rectangle 和 Ellipse 大 
小 相差 不 大 ， 因 此 考虑 到 malloc() 需要 占用 额外 的 管理 空间 ， 而 且 
还 得 费 工夫 去 调用 free()， 我 认为 这 里 并 不 应 该 采用 另行 分 配 内 存 的 
pa 


在 Shape 中 加 入 prev 和 next 的 做 法 让 人 感到 不 快 。Shape 
只 不 过 是 个 图 形 ， 不 管 是 要 用 链表 来 管理 ， 还 是 用 数组 来 管理 ， 都 是 


使 用 方 的 自由 。 然 而 ， 在 这 个 例子 中 ，Shape 从 一 开始 就 是 双向 链 
表 的 元 素 。 这 一 点 非常 奇怪 。 





上 面 的 批评 不 无 道理 。 在 某 些 程序 中 ， 或 许 到 处 都 需要 使 用 与 链表 
无 关 的 Shape。 在 这 种 情况 下 ， 有 人 认为 可 以 考虑 把 prev 和 next 
都 设置 成 NULL， 但 也 有 人 认为 如 果 代 码 中 总 夹杂 着 原本 并 不 需要 的 内 
容 ， 会 非常 奇怪 ， 这 种 想法 也 非常 正常 。 


因此 ， 我 们 可 以 考虑 不 在 Shape 中 加 入 prev 和 next， 而 是 像 
下 面 这 样 男 行 定义 一 个 叫 作 LinkableShape 的 类 型 ， 再 将 Shape 放 
到 该 类 型 中 (图 5-15) 。 


typedef struct LinkableShape tag { 
Shape shape; 
struct LinkableShape tag *prev; 
struct LinkableShape tag *next; 
} LinkableShape; 





LinkableShape 





图 5-15 Shape 的 你 存 方法 (其 二 


只 是 ， 如 果 使 用 这 种 方法 ， 那 么 在 将 Shape 保存 到 链表 中 时 ， 就 
需要 复制 整个 shape。 一 旦 进行 了 复制 ， 地 址 就 会 发 生 改变 ， 所 以 如 
果 某 处 存在 指向 原来 的 Shape 的 指针 ， 就 会 带 来 麻烦 。 


为 了 避免 这 个 问题 ， 可 以 考虑 仅 将 Shape 的 指针 保存 在 
Linkableshape 中 (图 5-16) 。 


typedef struct LinkableShape tag { 
Shape *shape; 


struct LinkableShape tag *prev; 
struct LinkableShape tag *next; 
} LinkableShape; 





LinkableShape 





图 5-16 ”Shape 的 保存 方法 (其 三 ) 


但 这 种 方法 也 有 缺点: 随 着 malloc() 次 数 的 增加 ， 管 理 空间 的 
内 存 会 出 现 浪费 ， 调 用 free() 所 需 的 精力 也 会 随 之 增加 。 考 虑 到 这 
些 问 题 ， 我 突然 觉得 如 果 只 是 绘图 工具 这 种 程度 的 用 途 ， 完 成 可 以 采用 
最 初 的 在 Shape 中 加 入 prev 和 next 的 方法 来 简单 地 实现 。 


三 


为 了 在 绘图 工具 中 表示 图 形 已 被 选中 ，Shape 中 包含 了 
selected 这 一 标志 ， 但 图 形 被 选中 之 类 的 状态 ， 只 不 过 是 用 绘图 工 


具 编 辑 图 像 的 过 程 中 很 短暂 的 临时 状态 而 已 。 把 这 也 作为 成 员 放 到 
Shape 结构 体 中 真 的 好 吗 ? 





这 又 是 一 个 无 可 厚 非 的 批评 。 比 如 ， 在 将 绘图 工具 生成 的 图 片 保存 
到 文件 中 时 ， 就 没有 必要 保存 selected。 假 设 我 们 要 实现 一 个 用 于 打 
印 绘图 工具 生成 的 文件 的 程序 ， 虽 然 这 个 打印 程序 也 需要 引用 Shape 
结构 体 ， 但 对 打印 程序 来 说 ，selected 成 员 不 是 必需 的 。 姑 且 先 不 说 
二 维 的 绘图 工具 ， 就 算是 CAD 等 ， 也 是 根据 CAD 生成 的 数据 来 切割 形 
状 *， 或 者 进行 模拟 的 。 总 之 ， 数 据 会 被 用 在 各 种 用 途中 。 因 此 ， 我 们 
一 般 不 太 推 荐 把 “是 否 被 选中 ”等 临时 状态 放 到 shape 中 。 


PS i dB ts Be 
0 机。 





如 果 不 把 selected 包含 在 Shape 中 ， 就 可 以 考虑 将 当前 被 选中 
的 Shape 列表 保存 在 指向 Shape 的 指针 的 数组 或 链表 中 ， 这 样 可 以 
确保 Shape 中 没有 不 必要 的 脏 数据 。 另 外 ， 例 如 在 网 络 聊天 工具 这 样 
的 软件 中 ， 在 由 多 人 编辑 一 张 图 片 的 情况 下 ， 对 于 每 个 参与 者 来 
说 ，“ 被 选中 的 图 形 ” 都 不 一 样 ， 这 就 需要 通过 这 样 的 方法 将 “被 选中 
的 图 形 ” 从 Shape 中 分 离 出 来 。 


但 是 ， 在 多 个 图 形 被 选中 的 状态 下 抓 取 图 形 并 拖 忠 移动 时 ， 我 们 希 
望 绘图 工具 优先 抓 取 已 被 选中 的 图 形 ”。 并 且 ， 在 被 选中 的 图 形 中 ， 优 
先 抓 取 显示 在 较 上 层 的 图 形 ， 也 就 是 说 ， 必 须 逆 序 对 Shape 的 链表 进 
行 抓 取 。 在 实现 这 些 功 能 时 ， 需 要 将 被 选中 的 图 形 与 Shape 的 链表 分 
开 管 理 ， 但 我 觉得 这 样 比较 麻烦 ， 所 以 这 次 就 把 selected 包含 到 
Shape 中 了 。 当 然 ， 你 也 可 以 选择 其 他 的 实现 方案 。 


”有 相当 多 的 绘图 工具 并 没有 认真 思考 过 这 一 点 。 此 时 会 出 现 诸多 问题 ， 比 如 错误 地 


抓 取 了 附近 的 其 他 图 形 ， 现 有 的 选中 状态 被 无 效 化 。 





由 此 可 见 ， 数 据 结 构 是 最 终 权 衡 各 种 利弊 之 后 的 选择 ， 不 存在 什 
么 捷径 。 将 数据 的 特征 及 其 使 用 方法 研究 透彻 ， 并 选择 最 佳 的 手法 是 设 
计 者 的 责任 。 此 时 ， 设 计 者 还 必须 充分 考虑 malloc()、realloc() 


的 内 部 实现 。 


设计 者 需要 根据 由 现状 预想 出 来 的 使 用 方法 、 将 来 的 扩展 性 等 ， 设 
计 出 在 速度 、 内 存 两 方面 都 高 效 ， 并 且 对 程序 员 来 说 也 便于 使 用 的 数据 
结构 ， 可 以 说 这 正 是 最 能 体现 设计 者 水 准 的 地 方 。 


补充 能 保存 任何 类 型 的 链表 
更 进一步 地 思考 图 5-16 的 方案 ， 还 可 以 想到 下 面 这 样 的 方法 。 


typedef struct Linkable tag { 
void *object; 
struct Linkable tag *prev; 
struct Linkable tag *next; 
} Linkable; 


由 于 Linkable 的 object 成 员 是 void* 类 型 ， 所 以 它 当 然 
可 以 指向 任何 类 型 。 也 就 是 说 ， 这 个 Linkable 可 以 保存 的 不 只 是 
Shape， 而 是 任何 类 型 。 


双向 链表 大 多 具有 指向 初始 元 素 和 末尾 元 素 的 指针 ， 因 此 为 了 保 
存 整个 双向 链表 ， 下 面 这 样 的 类 型 也 是 必要 的 。 


/* 用 于 保存 整个 双向 链表 的 类 型 */ 
typedef struct { 
Linkable *head; /* 链表 的 初始 元 素 */ 
Linkable *tail; /* 链表 的 末尾 元 素 */ 
} LinkedList; 


双向 链表 是 一 种 使 用 频率 相当 高 的 数据 结构 。 然 而 ， 每 次 开发 使 
用 双向 链表 的 程序 时 ， 都 要 重复 编写 “在 某 个 元 素 前 插入 元 素 ” 这 样 
令 人 烦 头 的 代码 ， 既 浪费 时 间 又 容易 引入 Bug。 


如 果 能 够 使 用 LinkedList 以 及 Linkable 这 样 的 类 型 ， 将 双 
人 就 可 以 避免 重复 那些 模式 化 的 编程 工 





但 是 ， 特 别 是 在 大 型 项 目 中 ， 这 种 方法 具有 致命 的 缺点 ， 这 个 缺 





点 正 是 由 “能 保存 任何 类 型 ”引起 的 。 问 题 就 在 于 ， 不 管 你 往 用 于 存 
放 shape 的 链表 中 装 入 日 萝卜 还 是 胡萝卜 ， 编 译 器 都 不 会 报错 。 


而 且 ， 光 看 代码 也 完全 搞 不 清 LinkedList 类 型 中 放 的 究竟 是 
什么 。 假 设 使 用 Point 的 链表 来 表示 Polyline， 如 下 所 示 。 


typedef struct { 
LinkedList list; 
} Polyline; 


完全 看 不 出 它 是 什么 东西 。 就 算 勉 强 看 出 它 是 个 链表 ， 但 如 果 没 
有 注释 什么 的 ， 也 根本 无 法 获知 它 是 Point 类 型 的 链表 。 这 会 对 程 
序 的 可 读 性 与 可 维护 性 造成 重大 的 恶劣 影响 。 

我 认为 ， 从 这 一 点 上 来 看 ，JavaScript、Ruby 和 Python 这 些 通常 
所 说 的 “无 类 型 ”语言 的 可 读 性 是 比较 差 的 。 

在 现代 的 具备 静态 类 型 的 语言 中 ， 为 了 不 需要 每 次 都 实现 链表 这 
样 的 数据 结构 ， 并 避免 引入 voidx 的 危险 ， 一 些 语 言 会 附带 被 称 为 
Generics 或 模板 的 功能 *。 但 是 ，5C 语 言 属 于 “古董 级 ”的 语言 ， 这 方 
面 就 比较 令 人 遗憾 了 。 


”不 过 ， 说 到 现代 语言 ，Go 中 是 没有 Generics 的 。 





5-2-5 图形 的 组 合 


大 多 数 绘图 工具 具备 组 合 功能 ， 能 够 将 多 个 图 形 整 合成 一 个 图 形 进 
行 处 理 。 下 面 考虑 为 X-Draw 引入 该 功能 。 


首先 ， 定 义 一 个 Group 类 型 。 虽 然 Group 类 型 应 该 包含 多 个 
Shape， 但 目前 由 于 Shape 本 身 能 够 创建 双向 链表 ， 所 以 只 要 在 
Group 中 定义 指向 初始 元 素 和 末尾 元 素 的 指针 即 可 。 


typedef struct { 
Shape *head; 


Shape *tail; 
} Group; 





组 合 就 是 将 多 个 图 形 整合 成 一 个 图 形 。 也 就 是 说 ， 组 合 而 成 的 “图 
形 组 ”， 其 本 身 也 可 以 说 是 一 种 图 形 。 因 此 ， 可 以 考虑 向 枚 举 类 型 
ShapeType 中 添加 图 形 组 的 设计 方案 。 


typedef enum { 
POLYLINE_SHAPE ， 
RECTANGLE_SHAPE ， 


CIRCLE_SHAPE， 
GROUP_SHAPE 
} ShapeType 





不 过 ， 可 能 会 有 人 感到 这 里 不 太 对 ， 认 为 把 Group 与 
Polyline、Rectangle 放 在 一 个 层面 上 有 点 奇怪 。 


但 我 认为 Group 也 是 一 种 Shape， 因 此 这 样 设计 未 党 不 可 。 只 是 
Shape 具有 颜色 或 填充 样式 ， 而 在 大 多 数 绘 图 工具 中 ， 图 形 组 并 不 一 
直 保 持 固 定 的 颜色 。 将 图 形 组 合 起 来 并 对 颜色 进行 更 改 ， 那 么 整个 图 形 
组 的 颜色 都 会 发 生 改变 ， 但 即便 后 来 取消 了 组 合 ， 各 个 图 形 也 不 会 恢复 
为 原来 的 颜色 ， 因 此 这 个 功能 并 不 是 更 改 图 形 组 的 颜色 ， 而 是 更 改 图 形 
组 内 所 有 图 形 的 颜色 。 


这 里 ， 我 们 先 把 Shape 分 类 为 折线 、 长 方形 这 样 的 “基本 图 
形 和 “图 形 组 。 





typedef enum { 
PRIMITIVE_SHAPE ， 
GROUP_SHAPE 

} ShapeType 


struct Shape tag { 


ShapeType type ; 
Boolean selected; 
union { 
Primitive primitive; 
Group group; 
} yu; 


struct Shape tag *prev; 


struct Shape tag *next; 
}; 


Primitive 类 型 中 持 有 原来 的 Shape 的 信息 。 


typedef enum { 
POLYLINE PRIMITIVE, 
RECTANGLE PRIMITIVE, 
ELLIPSE PRIMITIVE 

} PrimitiveType; 


typedef struct { 
/* 图 形 的 种 类 */ 
PrimitiveType type; 
/* 画笔 《轮廓 ) 的 颜色 */ 








Color line color; 

/* 填充 样式 。FILL_NONE 表 示 不 填充 */ 

FillPattern fill pattern 

/* 有 填充 时 的 颜色 */ 

Color fill color; 

union { 
Polyline polyline; 
Rectangle rectangle; 
Ellipse ellipse; 

} u; 


} Primitive; 


























这 样 一 来 ， 包 含 图 形 组 的 shape 的 数据 结构 就 如 图 5-17 所 示 。 
虽然 从 外 形 上 来 看 ， 它 与 5-1-6 市 中 的 树 形 结构 的 示例 有 所 不 同 ， 但 
它 其 实 也 是 一 种 树 形 结构 。 


Shape 





图 5-17 包含 图 形 组 的 图 形 的 数据 结构 
包含 到 目前 为 止 讨 论 的 所 有 内 容 的 头 文件 如 代码 清单 5-17 所 示 。 


代码 清单 5-17 shape.h 





#ifndef SHAPE_H_INCLUDED 
#define SHAPE_H_INCLUDED 


1 

2 

3 

4 typedef enum { 
5 FALSE = 6， 
6 TRUE = 1 

7 } Boolean 

8 


9 typedef struct { 


106 int red; 
11 int green; 
12 int blue; 
13 } Color; 

14 


15 typedef enum { 


16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 
28 
29 
30 
31 
32 
33 
34 
35 
36 
37 
38 
39 
46 
41 
42 
43 
44 
45 
46 
47 
48 
49 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 


















































FILL_NONE, /* 不 填充 */ 
FILL SOLID /* 实心 填充 */ 
} FillpPattern; 
typedef enum { 
POLYLINE PRIMITIVE, 
RECTANGLE PRIMITIVE, 
ELLIPSE PRIMITIVE 
} PrimitiveType; 
typedef struct { 
double Xi? 
double y; 
} Point; 
typedef struct { 
int npoints; 
Point *point; 
} Polyline; 
typedef struct { 
Point min_point; /* 左下 角 的 坐标 */ 
Point max_point; /* 右上 和 角 的 坐标 */ 


} Rectangle; 


typedef struct { 









































Point center; /+ 圆心 */ 
double h_radius; /* 横 癌 半径 */ 
double v_radius; /* 纵 回 半径 */ 
} Ellipse; 
typedef struct { 


/* 图 形 的 种 类 */ 


PrimitiveType type; 


/* 画笔 (轮廓 ) 的 颜色 


*/ 


Color line color; 


/* 填充 样式 。FILL_NONE 表 示 不 填充 */ 
FillPattern fill pattern; 




















/* 有 填充 时 的 颜色 */ 





Color fill color; 

union { 
Polyline polyline; 
Rectangle rectangle; 
Ellipse ellipse; 

} uu; 


} Primitive; 


typedef struct Shape tag Shape; 


65 typedef struct { 


66 Shape *head; 

67 Shape  *tail; 

68 } Group; 

69 

76 typedef enum { 

71 PRIMITIVE_SHAPE, 

72 GROUP_SHAPE 

73 } ShapeType; 

74 

75 struct Shape tag { 

76 ShapeType type ; 

77 Boolean selected; 
78 union { 

79 Primitive primitive; 
80 Group group; 

81 }u; 

82 struct Shape tag *prev; 

83 struct Shape tag *next; 

84 }; 

85 


86 #endif /* SHAPE_H_INCLUDED */ 





在 定义 Shape 类 型 时 Group 类 型 是 必需 的 ， 而 在 定义 Group 
类 型 时 指向 Shape 类 型 的 指针 是 必需 的 ， 它 们 形成 了 相互 依赖 的 关 
系 ， 因 此 我 们 在 第 63 行将 Shape 类 型 声明 成 了 不 完全 类 型 。 第 75 
行 以 后 的 代码 为 struct Shape_tag 类 型 定义 了 实体 。 


使 用 shape 这 种 数据 结构 的 程序 ， 例 如 绘制 所 有 图 形 的 程序 ， 如 


代码 清单 5-18 所 示 。 


代码 清单 5-18 draw_shapes.c 





1 #include <stdio.h> 

2 #include <assert.h> 
3 #include "shape.h" 

4 


5 void draw polyline(Shape *shape); 
6 void draw rectangle(Shape *shape); 


7 void draw ellipse(Shape *shape); 

8 

9 /* 

16 +* 前 提 是 通过 全 局 变量 shape_1list_head 和 shape _ list tail 
11 * 保存 shape 的 链表 的 初始 元 素 和 末尾 元 素 

12 */ 

13 Shape *shape list head; 

14 Shape *shape list tail; 











15 

16 void draw_shape(Shape *shape) 

17 { 

18 Shape *pos; 

19 

20 if (shape->type == PRIMITIVE SHAPE) { 
21 switch (shape->u.primitive.type) { 
22 case POLYLINE PRIMITIVE: 

23 draw_polyline(shape); 

24 break; 

25 case RECTANGLE PRIMITIVE: 

26 draw_rectangle(shape ) ; 

27 break ; 

28 Case ELLIPSE_PRIMITIVE : 

29 draw_ellipse(shape); 

30 break; 

31 default: 

32 assert(0); 

33 } 

34 } else { 

35 assert(shape->type == GROUP_SHAPE); 
36 for (pos = shape->u.group.head; pos != NULL; pos = pos->next) { 
37 draw_shape(pos); 

38 } 

39 } 

46 } 

41 

42 void draw all shapes(void) 

43 { 

44 Shape *pos; 

45 

46 for (pos = shape list head; pos != NULL; pos = pos->next) { 
47 draw_shape(pos); 





图 形 的 具体 绘制 方法 是 依赖 于 窗口 系统 的 ， 因 此 这 里 假设 了 一 个 这 
样 的 函数 : 如 代码 清单 5-18 的 第 5 行 第 17 行 的 原型 声明 所 示 ， 只 


要 传 入 指向 Shape 类 型 的 指针 ， 就 绘制 各 种 图 形 。 


”从 常识 来 说 ， 非 static 函数 的 原型 声明 不 可 能 写 在 .c 文件 中 。 而 外 部 函数 的 原 


型 声明 必须 写 在 头 文件 中 ， 以 供 多 个 .c 文件 共享 。 这 里 只 是 为 了 使 示例 程序 无 警告 地 ) 
通过 编译 而 写 的 临时 的 原型 声明 。 





从 第 37 行 可 以 看 出 ， 在 绘制 图 形 组 时 ，draw_shape() 会 被 递归 
调用 。 在 像 这 样 遍 历 树 形 结构 时 ， 通 常 使 用 递归 调用 。 


5-2-6 ” 遂 过 指向 辫 数 的 指针 的 数组 分 配 处 理 


从 代码 清单 5-18 的 第 21 行 开 始 ， 程 序 根据 图 形 的 种 类 ， 利 用 
switch case 对 处 理 进 行 分 配 。 这 样 的 switch case 不 只 出 现在 绘 
制图 形 的 地 方 ， 在 通过 鼠标 选择 图 形 、 将 图 形 整 体 保 存 到 文件 中 以 及 加 
载 图 形 等 处 理 中 ， 都 可 以 看 到 它 的 身影 。 


如 果 像 这 样 在 程序 中 到 处 写 上 _ switch case， 那 么 一 旦 需要 增加 
图 形 的 种 类 ， 就 不 得 不 向 分 散在 各 处 的 switch case 逐 个 添加 
case。 这 不 仅 麻 烦 ， 也 容易 漏 改 ”。 


”在 代码 清单 5-18 中 ， 之 所 以 在 default 的 地 方 加 入 assert(6)， 就 是 为 了 尽早 


检测 出 这 种 漏 改 。 





为 了 《在 一 定 程度 上 ) 解决 这 个 问题 ， 在 5 语言 中 可 以 使 用 “ 通 
过 指向 函数 的 指针 的 数组 对 处 理 进行 分 配 ” 的 方法 。 


例如 ， 可 以 像 下 面 这 样 声 明 全 局 变量 draw_shape_func_table， 
并 对 其 进行 初始 化 。 


void (*draw_ shape func table[])(Shape *shape) = { 
draw_polyline, 
draw_rectangle, 


draw_ellipse, 


}; 

draw_shape_func_table 的 类 型 为 “指向 《以 指向 Shape 的 指 
针 为 参数 的 ) 函数 的 指针 的 数组 ” (看 不 明白 的 读者 请 重新 读 一 下 第 3 
章 ) 。 

在 指向 函数 的 指针 的 数组 的 各 个 元 素 中 ， 我 们 设置 了 指向 各 个 图 形 


的 绘制 函数 的 指针 〈 请 注意 上 面 的 draw_polyline 等 后 面 没 有 写 
()) ， 因 此 只 要 使 用 该 数组 ， 就 可 以 通过 指定 下 标 来 选择 绘制 函数 “图 


S=18) 5 


数组 的 各 个 元 素 指 向 各 个 图 形 的 绘制 函数 


draw shape func table 





图 5-18 指 疝 绘制 函数 的 指针 的 数组 
也 就 是 说 ， 使 用 该 数组 就 可 以 用 下 面 这 一 行 代码 替换 代码 清单 5- 
18 中 第 21 行 之 后 的 switch case。 


draw_shape _ func table[(int)shape->u.primitive.typel](shape); 


本 例 通 过 将 枚 举 类 型 PrimitiveType 转换 为 int 而 获取 了 0 “~ 
2 的 整数 ， 并 实现 了 根据 该 结果 选择 图 形 的 绘制 函数 。 然 后 ， 对 相应 的 
函数 使 用 函数 调用 运算 符 ()， 就 可 以 实际 执行 函数 调用 了 。 


如 果 把 “用 于 绘制 图 形 的 函数 ”“ 为 了 便于 我 们 在 点 击 鼠 标 后 选中 
图 形 而 计 算 距 离 的 函数 ”“ 用 于 将 图 形 的 信息 输出 到 文件 中 的 函数 ”都 





存放 到 数组 中 ， 并 将 用 于 初始 化 这 些 数组 的 声明 语句 都 整合 到 茶 一 个 
.c 文件 中 ， 在 需要 增加 图 形 的 种 类 时 就 无 须 修改 各 处 代码 了 。 


话说 回来 ， 如 果 觉 得 void (*draw_shape func table[]) 
(Shape *shape) 这 样 的 声明 可 读 性 差 ， 也 可 以 考虑 使 用 下 面 的 
typedef。 


typedef void (*DrawFunc)(Shape *shape); 


这 个 typedef 声明 了 “指向 (以 指向 Shape 的 指针 为 参数 的 ) 
函数 的 指针 ”类 型 的 DrawFunc， 因 此 draw_shape_func_table 的 
声明 可 以 写成 下 面 这 样 。 


DrawFunc draw shape func table[] = { 


5-2-7 ” 通 往 继承 与 多 态 之 路 


Ct++、Java 和 (0# 这 些 面向 对 象 的 语言 可 以 以 一 种 更 为 优雅 的 方式 
来 实现 根据 图 形 的 种 类 对 处 理 进行 分 配 的 功能 。 本 书 虽 然 是 C 语言 的 
参考 书 ， 但 也 不 妨 来 看 一 下 。 


简单 来 说 ， 面 向 对 象 的 语言 具有 以 下 功能 。 


)1. 在 面向 对 象 的 语言 中 ， 类 “粗略 地 讲 就 是 像 结构 体 一 样 的 对 象 ) 里 
面 不 但 可 以 放 入 变量 ， 还 可 以 放 入 函数 ， 这 些 函 数 称 为 方法 
(method) 。 

)2.， 在 面向 对 象 的 语言 中 ， 可 以 扩展 已 有 的 类 ， 生 成 新 的 类 ， 这 种 行为 
称 为 继承 〈inher itance) 。 例 如 ，Polyline 类 继承 了 Shape 
类 。 

)3. 继承 类 可 以 重 写 (override) 被 继承 的 类 的 方法 。 


通过 该 功能 将 draw() 方法 放 入 Shape 中 ， 再 根据 Polyline 
或 Rectangle 重 写 draw()， 就 可 以 通过 以 下 代码 (C++ 流派 ) 实现 
绘制 所 有 图 形 的 程序 。 





for (pos = head; pos != NULL; pos = pos->next) { 
pos->draw(); <-- 调用 pos 指 向 的 Shape 的 draw( ) 方 法 


} 


采用 这 种 写法 ， 当 pos 为 Polyline 了 时， 程序 就 会 自动 调用 
Polyline 的 draw() 方法 ; 当 pos 为 Rectangle 时 ， 则 会 自动 调 
用 Rectangle 的 draw() 方法 。 


如 此 一 来 ， 就 无 须 使 用 switch case 来 对 处 理 进 行 分 配 了 ， 这 样 
的 功能 称 为 多 态 (polymorphism) 。 


编程 语言 正在 日 新 月 异地 发 展 。 每 种 新 的 语言 都 会 开发 一 些 有 用 的 
新 功能 。 


补充 “将 draw( 放 入 Shape 中 真 的 好 吗 


将 draw() 方 法 放 入 Shape 中 ， 利 用 多 态 对 处 理 进 行 分 配 的 做 法 ， 
在 面向 对 象 的 入 门 书 中 经 常 被 作为 例题 使 用 。 


我 也 认为 ， 对 于 最 多 只 有 几 万 行 代 码 的 小 型 程序 来 说 ， 
将 draw() 放 入 Shape 中 是 有 效 的 。 但 是 ， 实 际 上 对 于 CAD 这 种 非常 非 
常 庞 大 的 系统 来 说 ， 从 各 方面 来 看 最 好 还 是 避免 使 用 这 种 手法 。 


定义 了 Shape 等 类 型 的 头 文件 shape. h 是 一 个 主要 的 头 文 
件 ， 其 中 的 大 量 内 容 将 被 整个 程序 引用 。 因 此 ，shape. h 的 内 容 必须 
经 过 充分 的 探讨 ， 一 旦 确定 下 来 就 不 应 该 再 轻易 改变 。 


然而 ， 如 果 将 draw() 方法 放 进 去 ， 那 么 在 每 次 更 改 draw() 


时 ，shape.h 都 会 发 生 改变 。 由 于 draw() 特别 容易 受 窗口 系统 等 
环境 的 影响 ， 所 以 从 可 移植 性 来 说 ， 这 会 是 一 个 很 严重 的 问题 。 如 果 
是 C++ 这 种 可 以 将 方法 的 声明 与 实现 分 开 编写 的 语言 还 好 ， 要 是 
Java 语言 ， 那 惑 无 论 如 何 都 无 法 逃避 这 个 问题 了 。 


或 许 有 人 会 想 : “如 果 问 题 出 在 窗口 系统 之 间 的 差异 上 ， 那 么 编 
写 一 个 函数 ， 在 每 个 窗口 系统 的 绘图 函数 上 加 一 层 壳 ， 以 此 来 抹 平 差 
异 不 就 好 了 了 吗 ? ”然而 ， 编 写 能 够 适用 于 所 有 窗口 系统 的 抽象 绘图 接 
口 这 件 事 并 不 现实 。 例 如 ， 本 书 中 到 目前 为 止 的 示例 都 假设 了 一 种 被 
称 为 即时 模式 的 绘图 模型 (Windows 的 GD1、UNIX 的 Xlib 等 都 是 





这 种 模型 ) ， 在 调用 绘制 图 形 的 函数 后 ， 丙 面 上 当场 就 能 显示 出 图 
形 ， 但 在 Windows 的 WPF (Windows Presentation Foundat ion， 
Windows 呈现 基础 ) 等 框架 中 ， 采 用 的 则 是 被 称 为 保留 模式 的 绘图 模 
型 。 在 该 模型 中 ， 图 形 并 不 是 被 “绘制 ”， 而 是 被 “登记 ”， 因 此 也 
可 以 认为 draw() 这 个 名 称 本 身 就 是 不 合适 的 。 


另外 ， 当 需要 将 在 Windows 的 GD1 上 制作 的 程序 移植 到 WPF 
上 时 ， 对 于 程序 本 身 ， 只 要 弃 用 旧 的 重 写 新 的 就 可 以 了 ， 但 对 数据 却 
不 能 这 样 处 理 。 数 据 的 生命 周期 大 多 比 程 序 的 生命 周期 长 得 多 ， 因 此 
要 尽 可 能 地 保持 数据 结构 〈 该 情况 下 就 是 shape. h) 不 发 生变 化 。 


而 在 CAD 等 工具 中 处 理 的 数据 ， 虽 说 是 图 形 (形状 ) 的 数据 ， 
却 并 不 总 是 只 能 用 于 draw() 。 我 们 也 常常 将 使 用 CAD 设计 出 来 的 
形状 保存 到 文件 数据 中 ， 再 由 完全 不 同 的 其 他 程序 读 取 并 进行 某 些 解 
析 。 在 这 种 情况 下 ， 对 执行 解析 的 程序 来 说 ，shape. h 也 是 必需 的 ， 
但 draw() 其 实 是 完全 用 不 上 的 。 数 据 有 可 能 会 超出 设计 数据 结构 


(目前 来 说 就 是 shape. h) 的 人 员 的 预期 ， 被 用 在 各 种 程序 中 。 


那么 ， 我 们 到 底 应 该 怎么 做 呢 ? 可 以 认为 像 C 语言 这 样 将 
数据 与 处 理 过 程 分 离 的 做 法 是 可 行 的 ， 问 题 在 于 由 图 形 的 种 类 不 同 而 
产生 的 switch case。 实 际 上 ， 我 认为 与 数据 的 生命 周期 相 比 ， 程 
序 可 以 看 作用 完 即 舍弃 的 ， 那 么 干脆 就 采用 switch case 的 写法 其 
实 也 未 党 不 可 。 另 外 ， 也 可 以 考虑 使 用 Visitor 模式 *"。 不 过 ， 在 
Visitor 模式 中 ，Polyline 或 Rectangle 会 并 列 在 Visitor 一 
侧 ， 所 以 这 种 方式 其 实 与 switch case 也 没什么 区 别 。 或 者 ， 在 所 有 
的 Shape 中 都 只 定义 用 于 将 形状 转换 为 折线 的 方法 ， 然 后 将 draw( ) 放 
到 类 的 外 面 ; 又 或 者 ， 在 Shape 中 只 保存 一 个 指向 规定 运行 时 动作 的 
对 象 的 指针 ， 然 后 当 把 Shape 从 文件 中 加 载 出 来 时 ， 通 过 Abstract 
Factory 模 式 实例 化 该 应 用 程序 特定 的 运行 时 对 象 


对 于 设计 者 来 说 ， 烦 恼 真是 无 穷 无 尽 啊 ! 


”这 是 一 种 设计 模式 [6] 。 





5-2-8 指针 的 可 怕 之 处 


大 多 数 绘图 工具 有 复制 图 形 的 功能 。 假 设 将 该 复制 处 理 写 成 下 面 这 
样 。 


/* 假设 指向 被 复制 的 图 形 的 指针 存放 在 shape 中 */ 


Shape *new_ shape; 





new_shape = malloc(sizeof(Shape)); 
*new_shape = *shape; 《-- 对 Shape 结 构 体 进行 整体 赋值 





/* 将 new_shape 连 接 到 链表 的 末尾 */ 


你 知道 这 个 程序 的 不 妥 之 处 在 哪里 吗 ? 


如 果 要 复制 的 Shape 是 长 方形 或 者 椭圆 ， 这 种 方法 应 该 没 问题 ， 
但 如 果 是 折线 ， 用 这 种 方法 复制 之 后 会 出 现 什么 情况 呢 ? 

Polyline 将 坐标 群 (Point 的 可 变数 组 ) 保存 在 其 他 的 内 存 空 间 
中 ， 它 本 身 只 保存 指向 该 处 的 指针 。 因 此 ， 即 使 通过 结构 体 的 整体 赋值 
对 Shape 进行 复制 ， 坐 标 群 的 这 部 分 也 不 会 被 复制 ， 最 终 将 出 现 多 个 
Shape 共享 同一 坐标 群 的 情况 (图 5-19) 。 


Shape 


Point 的 数组 


[TITTITITITITI 


可 


图 5-19 多 个 Shape 引 用 同一 坐标 群 
很 显然 ， 复 制图 形 的 目的 并 没有 达到 。 
改变 其 中 某 一 根 折 线 的 坐标 之 后 ， 另 一 根 折线 的 坐标 也 会 跟着 发 生 


变化 。 另 外 ， 如 果 在 删除 某 一 根 折线 时 通过 free() 释放 了 坐标 群 的 
内 存 空间 ， 就 会 造成 非常 严重 的 后 果 。 关 于 这 一 点 ， 我 们 曾 在 2-6-4 


节 中 进行 过 说 明 。 

像 这 样 ， 如 果 指 针 指向 了 与 程序 员 的 意图 相 异 的 位 置 ， 调 试 就 会 变 
得 异常 艰难 。 上 面 的 折线 的 示例 还 算是 简单 的 例子 ， 如 果 是 在 图 结构 竺 
更 加 复杂 的 数据 结构 中 发 生 指针 乱 指 的 情况 ， 结 局 往往 惨不忍睹 。 


人 们 在 抱怨 5 语言 的 指针 很 可 怕 时 ， 多 半 是 想 要 表达 下 面 的 意 


田 
/CN 


0 语言 的 指针 一 旦 指向 了 奇怪 的 地 址 ， 程 序 就 会 月 在意 想 不 到 的 


地 方 ， 这 才 是 最 可 怕 的 。 





这 当然 很 可 怕 。 但 是 ， 其 实 指针 还 有 更 加 可 怕 的 一 面 : 


一 旦 引用 关系 混乱 ， 调 试 就 会 变 得 相当 困难 ， 太 可 怕 了 ! 





前 一 种 可 怕 之 处 可 以 说 是 6 语言 特有 的 问题 ， 而 后 一 种 可 怕 之 处 
则 对 所 有 拥有 指针 的 语言 来 说 都 是 挥 之 不 去 的 梦 厦 。 


”如 果 是 具备 GC (Garbage Collection， 垃 圾 回收 ) 功能 的 语言 ， 能 够 回避 的 也 只 是 


与 free() 相关 的 问题 。 





5-2-9 那么， 指针 到 底 是 什么 呢 
本 章 通过 数据 结构 从 侧面 对 指针 进行 了 说 明 。 


在 使 用 图 形 说 明 〈 单 向 ) 链表 、 双 向 链表 、 树 、 外 链 ) 哈 希 等 数 
据 结 构 时 ， 必 定 会 出 现 “ 箭 头 ”， 这 里 的 “箭头 ”就 是 指针 。 


Pascal 之 父 尼 古 拉 斯 : 沃 斯 (Niklaus Wirth) 曾 指出 过 前 文 所 述 
的 指针 的 危险 性 ， 并 且 剖 述 了 数据 结构 中 的 指针 是 对 应 于 处 理 过 程 中 的 
goto 的 观点 (Algorithms + Data Structures = Programs [ds 


在 这 个 意义 上 ， 就 像 通过 if、for、while 等 控制 结构 可 以 避免 
使 用 goto 一 样 ， 如 果 语 言 的 功能 或 者 库 已 经 提供 了 支持 ， 那 么 程序 员 
即使 不 处 处 顾及 指针 ， 也 能 够 轻松 使 用 链表 这 样 的 常规 数据 结构 了 但 
0 语言 这 样 老 态 龙 钟 的 语言 除外 ) 。 然 而 ， 程 序 中 使 用 的 并 不 都 是 这 样 
的 常规 数据 结构 。 当 在 程序 真正 想 要 表示 的 数据 结构 中 出 现 箭 头 时 ， 就 
需要 使 用 指针 。 也 就 是 说 ， 指 针 是 构建 真正 的 数据 结构 时 必需 的 概念 ， 
在 如 今 正统 的 编程 语言 中 ， 富 无 疑问 一 定 能 够 使 用 指针 (有 些 语 言 不 将 
旨 针 称 为 指针 ， 而 是 称 为 引用 〉。 


说 到 5 语言 的 指针 特有 的 功能 ， 不 得 不 提 到 它 与 数组 之 间 微 妙 的 
兼容 性 ， 相 关 用 法 我 们 已 经 在 第 4 章 大 致 说 明 过 了 。 


关于 C 语言 ， 我 们 还 经 常 听 到 下 面 这 样 的 说 法 。 


0 语言 可 以 进行 与 硬件 密切 相关 的 编码 。 这 是 因为 C 语言 中 有 
二 5 





在 如 今 还 在 使 用 C 语言 的 开发 现场 中 ， 或 许 存在 因为 想 要 进行 与 
硬件 密切 相关 的 编码 而 使 用 C 语言 的 情况 。 但 即便 是 在 这 样 的 程序 
中 ， 也 存在 许多 不 与 硬件 密切 相关 的 部 分 *。 对 于 这 些 部 分 ， 只 要 理解 
了 第 4 章 讲解 的 常见 用 法 ， 以 及 本 章 讲解 的 将 指针 当 作 箭头 使 用 的 方 
法 ， 就 足够 了 。 


”将 “与 硬件 密切 相关 ”的 部 分 尽 可 能 地 压缩 到 一 个 比较 小 的 范围 中 ， 也 是 一 条 编程 


的 铁 律 





我 想 ，“ 将 指针 当 作 箭头 使 用 ” 才 是 5 语言 与 其 他 语言 中 通用 的 


和 针 的 真正 用 法 。 


| 第 6 章 
其 他 一 一 拾 还 
6-1 新 的 函数 组 | 


ANS1 C 之 后 的 C、C99 和 C11 中 新 添加 了 可 以 进行 边界 检查 的 函 
数 〈 以 提高 安全 性 ) ， 以 及 经 过 改进 而 无 须 使 用 静态 存储 空间 的 函数 。 


在 可 用 的 运行 环境 下 ， 与 其 使 用 老 古董 级 的 函数 ， 不 如 使 用 这 些 新 函 
数 ， 


了 解 了 这 些 函 数 的 设计 ， 就 可 以 在 自己 编 瑟 函数 时 拿 它 们 作为 


6-1-1 沫 加 了 污 围 检查 的 郧 数 〈C111) 


2-5-4 市 中 提 到 ， 在 5 语言 中 ， 对 数组 进行 越 弄 写 入 有 可 能 引发 
缓冲 区 溢出 漏洞 。 正 如 我 们 所 说 的 那样 ， 尽 管 gets() 函数 是 从 外 部 
但 它 无 法 进行 范围 检查 ， 因 此 C11 中 最 终 删 除了 该 


为 替代 gets() 函数 ，C11 提供 了 能 够 进行 范围 检查 的 gets_s() 
函数 。 除 此 之 外 ，C11 中 还 新 增 了 strcpy_s()、sprintf_s() 等 函 
数 *。 在 此 ， 我 们 以 strcpy_s() 为 例 进行 讲解 。 


但 这 些 函 数 是 C11 的 Annex K 中 的 可 选 功能 ， 所 以 并 不 保证 一 定 可 以 使 用 。 





strcpy s() 原本 是 Microsoft 从 Visual Studio 2005 开始 实 
现 的 函数 ， 后 来 被 C11 采用 。 首 先 ， 我 们 从 C11 的 标准 文档 中 引用 
strcpy_s() 的 形式 。 


#define  _STDC WANT LIB EXT1 _1 
#include <string.h> 


errno t strcpy_s(char * restrict s1, 
rsize t simax, 
const char * restrict s2); 





突然 出 现 这 么 多 陌生 的 内 容 ， 是 不 是 感到 有 些 不 知 所 措 ? 


首先 ， ”STDC_WANT_LIB_EXT1 ”是 为 了 使 用 Annex K 的 函数 组 
而 通过 #define 定义 的 宏 。 然 后 ，strcpy_s() 的 参数 sl1、s2 所 附 
带 的 restrict 关键 字 用 于 修饰 指针 ， 帮 助 编译 器 实现 优化 (参考 本 
节 的 补充 内 容 ) 。 标 准 规定 ，rsize _t 类 型 是 比 RSIZE_MAX 还 要 小 
的 整数 类 型 。RSIZE_MAX 是 在 假设 当 出 现 过 于 庞大 的 数字 时 就 认为 发 
生 了 某 种 Bug 〈 例 如 负 值 被 当 作 unsigned 来 处 理 等 情况 ) 的 基础 上 
规定 的 一 个 表示 现实 可 行 的 对 象 大 小 的 数 。 


strcpy_s() 用 于 将 s2 指向 的 字符 串 复制 到 s1 指向 的 内 存 空间 

中 。 如 果 strcpy_s() 的 作用 仅 限 于 此 ， 那 它 就 与 strcpy() 一 样 
了 ， 但 其 实 由 于 此 处 可 以 通过 第 2 个 参数 slmax 传递 s1 所 指 的 内 
存 空间 的 大 小 ， 所 以 该 函数 还 能 够 进行 范围 检查 。 一 旦 向 s2 传递 比 
slmax 长 的 字符 串 ， 错 误 处 理 程序 就 会 被 调用 。 虽 然 错 误 处 理 程序 也 
可 以 由 程序 员 (使 用 set_constraint_handler_s() 函数 ) 来 设 
置 ， 但 在 最 初 实现 strcpy_s() 的 Microsoft 的 开发 环境 《Visual 
Studio) 中 *， 默 认 的 错误 处 理 程序 会 让 程序 就 此 月 溃 。 


”0 语言 标准 中 规定 ， 默 认 的 错误 处 理 程序 的 行为 由 开发 环境 定义 。 





此 处 ，“ 让 程序 就 此 有 衣 溃 ”的 行为 很 重要 。 我 们 不 应 该 采用 “复制 
slmax - 1 个 字符 ， 并 用 空 字符 作为 结尾 ”的 做 法 。“ 尝 试 复制 比 预 
想 的 长 度 长 的 字符 串 ” 本 身 就 是 Bug， 有 Bug 的 程序 理应 尽早 扼杀 。 
郑重 其 事 地 把 在 意 想不到 的 地 万 中 断 的 字符 串 保留 下 来 也 没有 任何 意 


义 。 


假设 有 “该 服务 中 用 户 ID 需 在 8 个 字符 以 内 ”这 种 对 字符 个 数 
的 限制 ， 那 么 我 们 就 应 当 在 最 开始 输入 的 时 间 点 进行 一 次 检查 〈 当 然 ， 
此 时 会 给 用 户 报 出 适当 的 错误 消息 ) 。 明 明 已 经 在 输入 时 进行 了 检查 ， 
结果 后 来 又 超过 了 8 个 字符 ， 那 显然 是 出 现 Bug 了 。 因 此 ， 应 该 在 错 
误 保 存 的 数据 覆盖 正确 数据 之 前 ， 或 者 将 错误 的 数据 传递 给 别 的 系统 之 
前 将 程序 终止 。 


如 果 ANSI1 C 的 sprintf() 的 格式 化 结果 是 比 缓冲 区 还 长 的 字符 
串 ， 内 存 空间 就 会 遭 到 破坏 。 为 了 解决 该 问题 ，C99 中 增加 了 
snprintf() 函数 ， 该 函数 会 在 字符 串 的 长 度 超 过 人 参数 指定 的 缓冲 区 长 
度 时 ， 根 据 缓冲 区 长 度 在 结果 的 末尾 添加 空 字符 。 而 C11 中 提供 的 是 
sprintf_s() 函数 ， 一 旦 字符 串 的 长 度 超 过 指定 的 缓冲 区 长 度 ， 该 表 
数 就 会 调用 错误 处 理 程 序 〈 也 就 是 说 ， 如 果 使 用 的 是 Visual Studio， 
程序 就 会 朋 溃 ) 。 不 过 在 使 用 sprintf() 系列 的 函数 时 ， 也 存在 不 调 
用 一 下 就 不 知道 是 否 会 超出 缓冲 区 长 度 的 情况 ， 此 时 就 可 以 使 用 C11 
的 snprintf_s()。 在 字符 串 的 长 度 超过 缓冲 区 长 度 时 ， 该 函数 不 会 调 
用 错误 管理 程序 ， 而 会 将 负 值 作 为 返回 值 返回 。 


说 起 来 ，“strcpy() 很 危险 ， 会 使 内 存 空间 遭 到 损坏 。 应 该 使 用 
能 够 很 好 地 传递 缓冲 区 长 度 的 strncpy()” 这 种 前 后 矛盾 的 主张 曾 大 
行 其 道 。 然 而 ， 事 实 上 strncpy() 会 在 字符 串 长 度 超过 缓冲 区 长 度 时 
生成 不 以 空 字符 结尾 的 字符 串 ， 所 以 它 才 是 非常 危险 的 。 要 是 使 用 这 
样 的 函数 ， 即 使 没有 当场 引起 内 存 空 间 的 损坏 ， 也 有 可 能 在 其 他 地 方 引 
发 更 加 严重 的 Bug。 我 基本 上 只 会 在 需要 实现 像 1-3-6 节 的 补充 内 容 
中 提 到 的 my_strncpy() 那样 的 函数 时 ， 或 者 在 操作 固定 长 度 字段 的 
数据 时 ， 才 会 使 用 strncpy()。 


说 点 题 外 话 ， 我 曾经 听 到 过 下 面 这 样 一 个 故事 。 


有 一 个 程序 员 写 了 下 面 这 样 的 代码 。 


strncpy(dest, src, strlen(src) + 1); 


“ 阿 ? 什么 东西 呀 这 是 。 明 明 用 strcpy() 就 可 以 了 嘛 ! ” 





“因为 他 听 说 strncpy() 更 安全 。 





我 以 为 这 就 是 一 个 还 不 错 的 笑料 …… 没 想到 这 似乎 是 真 事 儿 。 


裤 充 restrict 关 键 字 


Cc99 中 增加 的 restrict 关 键 字 用 于 修饰 指针 ， 可 以 通过 明确 表 
示 “ 没 有 其 他 指向 相同 对 象 的 指针 ”为 编译 器 提供 优化 的 提示 。 


= tt 即使 指向 了 不 同 的 元 素 ， 但 只 要 指向 
的 是 同一 个 数组 ， 就 可 以 说 是 指向 相同 对 象 。 亦 即 ， 在 上 述 
strepy_s() 的 媚 明 中 的 e152 前 添加 了 rectrict 就 意味 着 复制 源 
与 复制 目的 地 的 内 存 空间 是 不 能 重复 的 。 如 果 向 strcpy_s() 传 递 了 
重复 的 内 存 空间 ， 则 程序 在 这 种 情况 下 的 行为 是 未 定义 的 (也 就 是 
说 ， 调 用 方 有 责任 确保 不 传递 重复 的 内 存 空间 〉。 


errno t strcpy_s(char * restrict sl1, 
rsize t simax, 
const char * restrict s2); 


本 来 在 strcpy() 中 ， 在 复制 源 与 复制 目的 地 之 间 来 传递 重复 的 


内 存 空 间 时 的 动作 ， 在 099 之 前 是 未 定义 的 。 由 于 099 中 显 式 地 写 明 了 
这 一 点 ， 所 以 像 strcpy() 这 样 从 前 就 有 的 函数 也 从 C99 开 始 被 添加 了 
pe 其 中 最 明显 的 是 memcpy() 与 nemmove() : 原本 不 能 传递 
重复 内 存 空间 的 memcpy() 加 上 了 restrict， 而 被 设计 成 可 以 传递 重 
复 内 存 空间 的 memmove() 则 没有 加 。 


void *memcpy(void * restrict s1， 
const void * restrict s2， 
size t n); 


void *memmove(void *s1, const void *s2, size t n); 


可 以 通过 restrict 表 明 没 有 其 他 指向 相同 对 象 的 指针 的 范围 
是 : 当 restrict 被 添加 到 上 述 strcpy_s() 这 样 的 函数 的 形 参 中 时 ， 





范围 为 该 函数 内 部 ， 当 restrict 在 代码 块 内 部 ， 并 且 没 有 添 
加 extern 时 ， 范 围 为 该 代码 块 内 部 。 





6-1-2 ”无须 使 用 静态 存储 空间 的 子 数 (C11) 


在 2-5-3 市 的 补充 内 容 中 ， 我 们 提 到 标准 库 中 有 一 个 叫 作 
SE 的 函数 ， 该 函数 也 有 着 类 似 的 性 质 ， 因 而 时 常 车 得 大 家 怨 声 
lJ 刁 。 


假设 将 以 逗号 分 隔 的 字符 串 保存 在 char 类 型 的 数组 str 中 ， 那 
0 strtok()， 即 可 依次 取出 以 逗号 分 隔 的 “ 令 


char str[] = "abc,def,ghi"; 
char *t; 


/* 仅 在 第 1 次 调用 时 ， 将 对 象 字符 串 传 递 给 第 1 个 参数 */ 


t = strtok(str,","); /* t 指 向 “abc”*/ 
/* 在 第 2 次 及 其 后 的 调用 中 ， 将 第 1 个 参数 设 为 NULL */ 
t = strtok(NULL, ","); /* t 指 向 “def”*/ 
t = strtok(NULL, ","); /* t 指 由 “ghi” */ 








strtok() 以 空 字符 结束 返回 的 令 牌 ， 但 这 是 通过 以 破坏 性 的 方式 
强行 对 原来 的 字符 串 〈 这 里 就 是 str) 插入 空 字符 实现 的 。 这 个 设计 本 
身 让 人 感觉 不 太 好 ， 不 过 这 里 姑且 认为 它 没 问 题 。 


如 你 所 见 ， 在 对 strtok() 的 第 2 次 及 其 后 的 调用 中 ， 对 第 1 
个 参数 都 只 传递 NULL。 之 所 以 能 够 以 这 样 的 方式 分 隔 令 牌 ， 是 因为 
strtok() 的 内 部 通过 静态 变量 保存 了 指向 “剩余 的 字符 串 ” 的 开头 的 
指针 。 在 这 种 设计 中 ， 当 一 个 地 方正 在 使 用 strtok() 上 时， 程序 的 其 
他 地 方 是 无 法 使 用 strtok() 的 。 这 样 一 来 ， 就 无 法 适用 于 多 线程 编 
程 了 ， 而 且 即 便 是 单线 程 ， 例 如 在 以 逗号 分 隔 的 字符 串 的 一 项 内 容 中 含 
有 用 冒号 分 隅 的 多 项 信息 时 《比如 在 以 “ 书 名 , 作者 名 , 价格 , 发 行 年 
份 ……” 的 形式 通过 过 号 分 隔 的 图 书信 息 中 ， 作 者 为 多 人 的 情况 ) ， 也 
无 法 在 处 理 以 喜 号 分 隔 的 信息 的 同时 去 处 理 以 冒号 分 隔 的 信息 。 


因此 ，C11 中 引入 的 strtok_s() 变 成 了 如 下 形式 。 


#define _ _STDC WANT_ LIB EXT1 _ 1 
#include <string.h> 
char *strtok s(char * restrict s1, 


rsize t * restrict simax, 
const char * restrict s2， 
char ** restrict ptr); 





”第 1 个 参数 s1 是 作为 分 割 对 象 的 字符 串 ， 第 3 个 参数 s2 是 分 
隔 符 。 可 以 看 到 ， 这 两 个 参数 是 strtok() 中 也 有 的 参数 ， 而 第 2 个 
参数 slmax 和 第 4 个 参数 ptr 是 新 增 的 参数 。 


向 ptr 传递 的 是 在 调用 方 分 配 的 指向 char* 类 型 变量 的 指针 
(因此 ptr 的 类 型 就 是 指向 char 的 指针 的 指针 ) 。strtok() 将 指 
向 “剩余 的 字符 串 ” 的 开头 的 指针 静态 地 保存 在 strtok() 的 内 部 ， 
而 通过 传递 在 调用 方 准备 好 的 指向 char* 类 型 变量 的 指 
针 ，strtok_s() 就 能 够 使 用 该 变量 的 内 存 空间 了 ， 也 就 是 说 ， 该 变量 
的 内 存 空间 代 兰 了 内 部 的 静态 内 存 空间 ， 这 样 就 可 以 在 多 处 同时 使 用 
strtok s() 了 。 


第 2 个 参数 slmax 传递 的 是 保存 “作为 分 割 对 象 的 字符 串 的 长 
度 ” 的 rsize_t 类 型 变量 的 指针 。 由 于 *s1lmax 表示 “剩余 的 字符 个 
数 ”， 所 以 每 调用 一 次 ， 它 都 会 通过 strtok_s() 被 相应 地 减少 。 这 
就 是 我 们 特地 通过 指针 进行 传递 的 原因 。 


strtok_s() 的 使 用 示例 如 下 所 示 。 


char str[] = "abc,def,ghi"; 
char *t; 

rsize t silmax = sizeof(str); 
char *ptr; 


strtok s(str, &silmax, ",", &ptr); /* t 指 向 “abc”*/ 
strtok s(NULL, &silmax, ",", &ptr); /* t 指 向 “def” */ 
strtok_s(NULL, &simax, ",",，&ptr); /* t 指 向 “ghi” */ 








除了 strtok_s()，0C11 中 还 增加 了 几 个 函数 ， 比 如 与 日 期 相关 的 
函数 ctime()、asctime()、localtime()， 以 及 gmtime() 的 不 使 
用 静态 内 存 空间 的 版 本 ， 即 


ctime s()、asctime s()、localtime s() 和 gmtime s() 等 。 


另外 ， 让 人 感到 混乱 的 是 ，Visual Studio 版 的 strtok_s() 中 
并 没有 C11 中 的 slmax 参数， 并 且 只 有 3 个 人 参数。 


6-2 ”陷阱 | 


6-2-1 整数 据 升 


例如 ， 从 标准 输入 读 入 1 个 字符 的 getchar() 取 数 的 返回 值 类 
型 是 int。 


初学 者 通常 会 有 这 样 的 疑问 : “如 果 是 读 入 1 个 字符 ， 返 回 值 的 
类 型 用 char 不 就 行 了 吗 ? ”对 此 ， 我 们 常会 听 到 这 样 的 解释 : “ 那 是 
为 了 表示 代表 文件 结束 的 EOF。 


这 个 回答 虽 不 能 说 是 错误 的 ， 但 这 就 无 法 解释 为 什么 putchar() 
的 参数 类 型 是 ijnt。 而 且 我 们 在 前 面 提 到 过 ，C 语言 中 字符 常量 ('a' 
等 ) 的 类 型 是 int (1-3-6 节 ) ， 因 此 我 觉得 可 以 这 么 认为 : 


在 5 语言 中 ， 用 于 表示 茶 个 对 象 不 是 字符 串 而 是 1 个 字符 的 类 


型 是 int。 





“ 咽 ? 字符 只 是 char (character) 类 型 这 种 程度 的 数据 ， 在 表示 
字符 时 ， 难 道 不 就 应 该 使 用 char 吗 ? ”这 一 质疑 不 无 道理 ， 得 其 实 6 
语言 会 使 用 一 种 称 为 整数 提升 〈integer promotion) ”的 功能 ， 在 表 
达 式 中 将 长 度 小 于 int 的 类 型 依次 提升 为 int。 


* ANS1 C 之 前 ， 该 功能 被 称 为 integral promotion， 但 在 C99 中 称 为 integer 


promotion， 不 知道 为 什么 要 做 这 样 的 改变 …… 





下 面 我 们 来 看 一 下 在 C 语言 的 标准 中 对 此 是 如 何 叙 述 的 。 


如 果 表 达 式 中 可 以 使 用 int 类 型 或 者 unsigned int 类 型 ， 
则 以 下 内 容 可 以 用 在 表达 式 中 。 


。 具 有 整数 类 型 的 对 象 或 者 表达 式 ， 该 澡 数 类 于 的 整数 转换 级 别 低 
于 int 类 型 以 及 unsigned int 类 型 

。_Bool 类 型 、int 类 型 、signed int 类 型 或 者 unsigned 
int 类 型 的 位 域 (bit field) 。 


如 果 int 类 型 能 够 代表 所 有 这 些 值 的 原始 类 型 ， 则 该 值 转换 成 
int 类 型 ， 否 则 转换 成 unsigned int 类 型 ， 这 称 为 整数 提升 。 除 
此 之 外 的 其 他 类 型 都 不 会 通过 整数 提升 发 生 改 变 。 


整数 提升 会 保留 包括 符号 在 内 的 值 。 是 否 将 “单纯 的 ”char 类 
型 视 为 有 符号 类 型 是 由 实现 定义 的 。 





“如 果 int 类 型 能 够 代表 所 有 这 些 值 的 原始 类 型 ， 则 该 值 转换 成 
int 类 型 ”这 句 话 是 关键 所 在 。 例 如 ， 由 于 unsigned char 类 型 的 
所 有 可 取 值 可 以 通过 〈 有 符号 的 ) int 类 型 表示 ， 所 以 unsigned 
char 类 型 在 表达 式 中 会 被 转换 为 int 类 型 。 


C 语言 规范 规定 ，unsigned 的 整数 在 超过 其 能 够 表示 的 最 大 值 时 
ee “ 回 绕 ” (wrap around) 。 也 就 是 说 ， 对 int 类 型 来 说 ， 在 32 
位 的 环境 中 对 0xFFFFFFFF 加 1 则 等 于 0， 加 2 则 等 于 1， 加 10 则 
等 于 9。 但 是 ， 由 于 unsigned char 或 unsigned short 会 通过 整 
数 提升 在 进行 加 法 运算 之 前 被 转换 成 int， 所 以 不 会 以 char 或 
short 的 位 宽 进 行 回 绕 。 因 此 ， 代 码 清单 6-1 中 unsigned int 时 
的 动作 与 unsigned char 时 的 动作 是 不 同 的 。 


代码 清单 6-1 integerpromotion.c 


1 #include <stdio.h> 


int main(void) 


2 

3 

4 

5 unsigned :int uint = @xffffffff; 
6 unsigned char uchar = @xff; 

7 
8 


if (uint + 106 < 16) { 


9 printf("uint + 10 < 106\n"); 
16 } else { 

11 printf("uint + 16 >= 16\n"); 
12 

13 

14 if (uchar + 106 < 16) { 

15 printf("uchar + 10 < 106\n"); 
16 } else { 

17 printf("uchar + 16 >= 106\n"); 
18 
19 printf("uchar + 106..%u\n", uchar + 10); 
20 uchar = uchar + 108; 
21 printf("uchar..%u\n", uchar); 





由 于 第 8 行 的 if 语句 中 进行 了 回 绕 ，uint + 16 将 等 于 9， 所 
以 程序 会 去 执行 第 9 行 的 printf()， 但 在 第 14 行 中 ， 由 于 uchar 
通过 整数 提升 变 为 了 int， 值 等 于 255，uchar + 16 等 于 265 (第 
19 行 ) ， 所 以 程序 会 去 执行 第 17 行 的 printf()。 


但 是 ， 如 果 将 计算 结果 再 次 赋 给 unsigned char 类 型 的 变量 (第 
20 行 ) ， 它 就 会 转换 成 unsigned char 类 型 ， 因 此 看 起 来 就 像 是 以 
char 的 位 宽 进 行 了 回 绕 一 样 。 


话说 回来 ， 也 有 人 认为 ， 由 于 C6 语言 中 并 没有 规定 int 或 long 
的 位 宽 ， 所 以 应 该 #include 头 文 件 stdint. h， 以 便 使 用 int32 t 
这 样 的 类 型 取代 int (甚至 还 有 一 种 更 极端 的 主张 认为 使 用 char 或 
int 就 是 错误 的 *) 。 的 确 ， 现 在 C 语言 主要 是 用 于 操作 系统 或 家 入 式 
开发 ， 在 这 些 领域 中 ， 肯 定 存在 一 些 需要 使 用 充分 考虑 了 位 数 的 类 型 的 
场景 。 但 是 ， 正 如 前 面 所 说 ， 说 到 底 int 类 型 与 比 自己 小 的 类 型 的 行 
为 是 不 同 的 ， 因 此 使 用 int32_t 这 样 的 类 型 时 也 需要 注意 这 一 点 。 
另外 ， 老 实说 我 对 于 将 “整数 类 型 的 位 数 ” 等 低层 次 的 概念 扩散 到 整个 
代码 中 的 做 法 本 身 是 抱 有 抵触 情绪 的 。 如 果 是 32 位 的 具有 某 种 意义 的 
人 人 先 通 过 typedef 定义 一 个 代表 这 个 
意思 的 另 o 


* 该 主张 来 自 How to C in 2016 这 篇 文章 。 





6-2-2 ”如 果 在 〈 老 式 的) 5 语言 中 使 用 float 类 型 的 参数 


想必 如 今 使 用 ANS1 C 之 前 的 C6 语言 的 人 已 经 不 多 了 ， 但 在 理解 
0 题 时 ， 我 们 是 不 可 能 绕 开 “老式 的 C6 语 


函数 的 原型 声明 是 从 ANS1 C 开始 引入 的 ， 在 那 以 前 的 0 语言 
中 ， 也 数 的 声明 仅 能 像 下 面 这 样 指 定 了 水 数 的 返回 值 ， 而 不 能 指定 参数 。 


double sin(); 


上 面 的 例子 是 三 角子 数 的 sin()， 而 sin() 的 参数 类 型 是 
double。 和 那么， 在 调用 sin() 时 ， 如 果 往 参数 中 传递 float 类 型 ， 
会 发 生 什么 情况 呢 ? 


在 ANSI1 C 的 math.h 中 ，sin() 的 声明 如 下 所 示 : 


double sin(double x); 


因此 ， 即 使 将 float 类 型 传递 给 参数 ， 编 译 颖 也 能 够 通过 类 型 转 
换 将 它 转 换 成 double。 


而 如 果 是 在 ANS1 5 之 前 的 5 语言 中 ， 又 会 发 生 什么 情况 呢 ? 答 
案 是 ，float 的 参数 还 是 会 被 转换 成 doubies 


在 ANSI C 之 前 的 C6 语言 中 ， 表 达 式 中 的 float 类 型 会 依次 被 
转换 成 double (与 整数 类 型 的 整数 提升 相同 ) 。 即 使 是 在 float 类 
型 之 间 进 行 加 法 运算 ， 并 将 结果 保存 到 float 类 型 的 变量 中 的 情况 ， 
也 遵循 以 下 步骤 。 


人 将 两 边 都 转换 成 double 类 型 。 








@ 进 行 double 类 型 的 加 法 运算 。 


@ 将 结果 转换 成 float 类 型 。 





因此 ， 使 用 float 类 型 时 的 运算 速度 会 比 使 用 double 类 型 时 慢 
得 多 。 这 正 是 “不 要 使 用 float 类 型 ”这 一 C6 语言 格言 (? ) 诞生 
的 由 来 ”。 


”当然 这 都 是 以 前 的 事情 了 。 对 于 float 类 型 之 间 的 运算 ， 如 今 的 5 语言 编译 器 通 
常 直接 使 用 float， 而 且 如 果 要 生成 较 长 的 数组 ， 还 是 使 用 float 比较 节约 存储 空间 。 





在 老式 的 C 语言 函数 参数 中 的 float 也 会 被 无 条 件 地 转换 
成 double。 因 此 ， 在 使 用 sin() 上 时， 向 参数 传递 的 oat 会 被 转 
换 成 double， 所 以 函数 是 能 够 正常 运行 的 。 关 于 这 一 点 ， 我 们 就 先 说 
到 这 里 。 接 下 来 看 一 看 如 果 我 们 编写 了 以 float 0 数 ， 结 果 
会 发 生 什 么 。 


用 老式 的 5 语言 编译 器 编译 代码 清单 6-2 与 代码 清单 6-3 的 两 
个 函数 ， 生 成 的 汇编 代码 将 也 就 是 说 ， 在 ANS1 C 以 
前 ， 当 形 参 的 类 型 为 float 时 ， 它 会 被 编译 器 不 声 不 响 地 解释 成 
double 〈 太 凶险 了 ) 。 


* 以 前 我 们 可 以 使 用 gcc 的 -traditional 选项 来 验证 ， 但 现在 的 gcc 已 经 不 再 
支持 -traditional 了 


代码 清单 6-2 float.c 





1 void sub func(); 
2 

3 void func(f) 

4 float 人 


sub_func(&f); 


代码 清单 6-3 double.c 


1 void sub func(); 
2 

3 void func(d) 

4 double dd; 


sub_func(&d); 





在 上 述 示例 中 ， 向 sub_func() 传递 的 是 形 参 的 指针 。 代 码 清单 
6-2 的 sub_func() 一 定 是 在 等 着 接收 “指向 float 的 指针 ”。 不 
幸 的 是 ，f 被 擅自 解释 成 了 double， 这 样 当然 无 法 正确 传递 了 。 


另外 ， 对 于 整数 类 型 ， 整 数 提升 也 会 引发 同样 的 问题 。 只 不 过 ， 在 
整数 类 型 的 情况 下 ， 函 数 将 先 以 int 的 形式 接收 参数 ， 然 后 将 其 缩小 
成 较 小 的 类 型 ， 因 此 不 会 发 生 上 述 问题 。 


| 不 论 是 整数 提升 ， 还 是 转换 成 double 的 做 法 ， 至 少 在 ANSI C 
之 前 的 C6 语言 中 ， 整 型 通常 会 转换 成 int， 而 浮 点 型 通常 转换 成 
double。 


6-2-3 printf() 与 scanf () 


上 一 节 我 们 提 到 了 “ANS1 0 之 前 的 6 语言 ”， 或 许 很 多 人 会 
想 : “这 年 头 肯 定 没 人 使 用 比 ANS1 5 还 古老 的 C 语言 了 了， 那些 知识 
跟 我 应 该 没 喻 关系 吧 ”。 这 种 想法 不 无 道理 ， 但 在 像 printf() 这 样 
具有 可 变 长 参数 的 函数 中 ， 原 型 声明 对 可 变 长 部 分 的 参数 是 不 起 作用 


的 。 因 此 ， 对 于 这 部 分 内 容 ， 需 要 引入 与 ANS1 C6 之 前 的 C6 语言 一 样 
的 转换 。 也 就 是 说 ， 比 int 小 的 整数 类 型 需要 提升 为 int，float 需 
要 提升 为 double。 


这 就 意味 着 ， 不 能 向 printf() 传递 char 类 型 或 float 类 
型 。 


什么 ? printf() 的 %c 不 是 可 以 传递 char 类 型 并 输出 这 个 


一 Ar 


子 付 吗 ? 





或 许 你 会 这 样 想 ， 然 而 应 该 传递 给 %c 的 类 型 其 实 是 int。 而 且 
即使 传递 了 char 类 型 的 变量 ， 这 个 变量 也 会 通过 整数 提升 被 转换 成 
int 类 型 。 


printf() 输出 float 时 使 用 %f， 输 出 double 时 使 用 


通 ; 


十 
%1f， 难 道人 不 是 吗 ? 





其 实 这 是 一 个 误会 〈 可 能 来 源 于 scanf() 的 转换 修饰 符 的 设 
计 ) 。 在 printf() 中 ，float 和 double 使 用 的 都 是 %f。 关 于 在 
printf() 中 使 用 %1f 时 的 行为 ， 在 ANS1 5 中 是 未 定义 的 ， 而 在 
099 中 则 是 “与 %f 相同 ”。 


同样 地 ，char 或 short 也 能 够 通过 %d 输出 。 


反之 ， 在 具有 可 变 长 参数 的 函数 这 一 侧 ， 经 常 出 现下 面 这 样 的 错误 
与 法 8 
va_arg(ap, char) 


va_arg(ap, short) 
va_arg(ap, float) 


话说 回来 ，scanf() 也 会 使 用 与 printf() 十 分 相似 的 转换 修饰 
符 。 那 些 习 惯 了 printf() 中 float 和 double 两 者 都 能 够 使 用 %f 
进行 输出 的 程序 员 往 往 会 期 望 scanf() 也 有 相同 的 功能 。 

然而 ， 由 于 传递 给 scanf() 的 是 指针 ， 所 以 不 能 进行 类 型 提升 。 
因此 ， 如 果 想 要 通过 scanf() 把 值 保存 到 double 类 型 的 变量 中 ， 就 
必须 指定 %1f。 


6-2-4 原型 声明 的 光与影 


近年 来 ， 使 用 ANS1 Cc 之 前 的 C6 语言 编写 的 代码 已 经 慢 慢 绝迹 
了 ， 但 以 前 我 们 经 常 需 要 将 老式 的 C 语言 代码 转换 成 ANS1 0。 


在 ANS1 C 中 ， 顶 数 定 义 是 与 成 下 面 这 样 的 。 


int func(int hoge, int piyo) 
{ 
} 


而 在 ANS1 C 之 前 的 5 语言 中 ， 则 是 下 面 这 样 。 


int func(hoge, piyo) 
int hoge; 
int piyo; 


{ 
} 





由 于 ANS1 C 中 也 允许 使 用 老式 的 写法 ， 所 以 即便 不 强制 地 将 函数 
定义 改写 成 新 的 形式 ， 也 可 以 通过 编译 。 但 是 ，ANS1 C 中 新 引入 的 范 
数 的 原型 声明 可 以 有 效 地 检 出 程序 员 的 编码 失误 ， 因 此 建议 大 家 务必 使 
用 新 的 函数 定义 方法 。 


逐个 改写 函数 定义 是 一 项 烦琐 的 工作 ， 于 是 或 许 有 人 会 像 下 面 这 样 


把 老式 的 函数 定义 就 这 么 原封 不 动 地 放 着 ， 只 把 原型 声明 写 进 头 





文件 不 就 好 了 了 吗 ? 





但 是 ， 请 大 家 回想 一 下 我 们 到 目前 为 止 的 讲解 。 


在 没有 原型 声明 的 情况 下 ， 人 参数 的 类 型 如 果 比 int 小 ， 则 会 被 依 
次 转换 成 int， 如 果 类 型 是 float， 则 会 被 依次 转换 成 double， 这 种 
转换 称 为 默认 人 参数 提升 (default argument promotion) 。 这 样 一 来 ， 
接收 参数 的 一 方 所 生成 的 机 器 码 就 必须 可 以 接收 转换 后 的 较 大 类 型 。 


反 过 来 说 ， 在 有 原型 声明 的 情况 下 ， 由 于 参数 会 以 声明 中 的 类 型 原 
封 不 动 地 传递 进来 ， 所 以 接收 参数 的 一 方 所 生成 的 机 器 码 就 也 必须 可 以 
将 声明 中 的 类 型 原封 不 动 地 接收 。 


但 是 ， 范 数 的 定义 与 函数 的 调用 万 可 能 存在 于 完全 不 同 的 编译 单元 
中 。 那 么 ， 编 译 器 在 编译 函数 定义 时 ， 是 依据 什么 决定 应 该 生成 上 述 两 
种 机 器 码 中 的 哪 一 种 的 呢 ? 其 实 这 是 依据 函数 定义 是 老式 的 还 是 新 式 的 
来 进行 判断 的 。 


”在 大 多 数 运 行 环境 中 的 确 是 这 样 的 。 在 标准 中 ， 在 没有 原型 的 状态 下 调用 具有 


char 或 float 参数 的 函数 的 整个 行为 是 未 定义 的 。 





对 于 老式 的 范 数 定义 ， 如 果 在 有 原型 声明 的 情况 下 执行 函数 调用 ， 
函数 定义 方 会 期 望 传递 过 来 的 是 执行 过 默认 参数 提升 的 类 型 ， 然 而 实际 
上 传递 的 是 没有 经 过 提升 的 原来 的 类 型 ， 这 残 有 可 能 导致 函数 无 法 正 前 


为 了 防 患 于 未 然 ， 在 定义 函数 的 文件 中 ， 必 须 #include 声明 了 
该 函数 自身 的 原型 的 头 文件 。 这 样 一 来 ， 只 要 是 正 儿 八 经 的 编译 器 ， 那 
就 应 该 能 够 对 原型 与 函数 定义 不 一 致 的 情况 给 出 警告 。 反 正 哪 怕 没 有 这 
个 问题 ， 只 要 想 让 编译 器 为 我 们 检测 出 函数 定义 与 原型 声明 不 一 致 ， 就 
必须 在 定义 函数 的 代码 中 #include 函数 原型 “。 如 果 原 型 与 实际 的 函 


数 定义 不 一 致 ， 那 么 好 不 容易 在 ANS1 5C 中 引入 的 机 制 就 会 变 得 形 同 虚 
设 (甚至 可 以 说 是 有 害 的 ) 。 


”实际 上 ， 以 前 我 也 曾 见 过 不 检查 函数 定义 与 原型 之 间 参 数 是 否 不 一 致 的 编译 器 


要 点 


在 定义 函数 的 源 文件 中 ， 必 须 #include 包含 该 函数 自身 的 原 
型 声明 的 头 文件 。 





而 且 ， 在 调用 定义 在 其 他 文件 中 的 函数 时 ， 必 须 #include 包含 
原型 声明 的 头 文 件 。 不 过 ， 人 总 是 会 犯错 的 ， 因 此 应 该 提高 编译 器 的 警 
告 级 别 ， 使 其 能 够 在 程序 调用 无 原型 声明 的 函数 时 给 出 警告 。 


另外 ， 在 某 些 运行 环境 中 ， 为 了 提高 运行 速度 ， 需 要 使 用 寄存 器 而 
不 是 栈 来 传递 参数 。 但 即使 在 这 样 的 环境 中 ， 对 于 具有 可 变 长 参数 的 函 
数 ， 还 是 需要 通过 栈 来 传递 参数 ， 但 关于 函数 是 否 具有 可 变 长 参数 ， 调 
用 方 只 能 通过 原型 声明 来 判断 。 


因此 ， 在 这 样 的 环境 中 ， 不 #include 头 文件 stdio. h， 就 无 法 
正常 使 用 printf() 。 


要 点 


在 调用 定义 在 其 他 文件 中 的 函数 时 ， 必 须 #include 包含 原型 
声明 的 头 文件 。 





6-3 惯用 与 ; | 


6-3-1 结构 体 声 明 


下 面 这 种 写法 虽然 颇具 争议 ， 但 我 在 声明 结构 体 时 必定 会 像 这 样 同 
时 使 用 typedef 定义 类 型 。 


typedef struct { 
int a; 


int b; 
} Hoge; 





另外 ， 如 果 不 是 特别 必要 的 情况 ， 我 一 般 不 写 标签 。 如 果 写 标 
签 ， 则 会 像 下 面 这 样 。 


”因为 如 果 只 在 特别 必要 的 情况 下 才 写 标签 ， 那么 只 要 看 到 标签 ， 我 就 会 知道 前 面 代 
i aa 但 也 有 人 主张 “既然 不 知道 什么 时 候 必 须 加 标签 ， 那 就 都 写 上 ”， 对 
表示 理解 。 


typedef struct Hoge tag { 
int a; 
int b; 

} Hoge; 





过 在 要 定义 的 类 型 名 称 后 面 添 加 _tag 的 形式 来 添加 标签 


另外 ， 由 于 结构 体 、 联 合体 、 枚 举 的 标签 名 与 一 般 的 标识 符 具 有 不 
同 的 命名 空间 ， 所 以 也 可 以 采取 下 面 这 样 的 写法 。 


typedef struct Hoge { 
int a; 


int b; 
} Hoge; 


因为 这 样 写 就 与 C++ 具有 相同 的 意义 了 ， 所 以 也 有 人 偏好 这 种 写 





法 。 


在 声明 结构 体 时 ， 也 可 以 同时 定义 该 结构 体 类 型 的 变量 ， 不 过 我 一 
般 不 会 这 么 做 。 一 方面 是 因为 在 一 门 心思 要 写 typedef 时 ， 我 不 会 想 
着 去 用 这 种 写法 ， 另 一 方面 是 由 于 类 型 的 声明 与 变量 的 定义 是 不 同 的 概 
念 ， 所 以 应 该 分 别 写 。 


/* 我 一 般 不 采用 的 写法 */ 
struct Hoge tag { 





int a; 
int b; 
} hoge; <-- 声明 struct Hoge_tag 类 型 的 变量 hoge 








顺便 提 一 下 ， 结 构 体 的 成 员 的 声明 也 与 一 般 的 变量 声明 一 样 ， 可 以 
一 次 性 声明 多 个 成 员 ， 不 过 我 从 来 没有 这 样 写 过 。 


/* 我 一 般 不 采用 的 写法 */ 
typedef struct { 

int a, b; 
} Hoge; 








另外 ， 有 人 会 在 typedef 结构 体 的 同时 ， 把 指向 该 结构 体 的 指针 
类 型 也 一 起 typedef 出 来 。 


typedef struct { 
int a; 


int b; 
} Hoge，*HogeP; <-- 同时 声明 Hoge 及 其 指针 类 型 HogeP 























这 样 就 可 以 以 HogeP hoge_p; 的 形式 声明 指向 Hoge 的 指针 类 
型 的 变量 ， 但 我 认为 “通过 添加 * 显 式 地 表明 这 是 指针 ”的 代码 可 读 
性 更 强 一 些 ， 因 此 我 也 不 会 采用 这 种 写法 。 

6-3-2 ” 自 引 用 结构 体 


在 构造 链表 或 树 形 结构 时 ， 需 要 编 瑟 包含 指向 与 声明 的 类 型 相同 类 
型 的 指针 的 结构 体 。 


这 样 的 结构 体 似乎 被 称 为 自 引 用 结构 体 一 一 之 所 以 说 “似乎 ”， 是 


因为 先 不 论 C 语言 的 入 门 书 ， 人 至 少 在 开发 现场 ， 我 从 来 没有 听 到 过 有 
人 这 样 叫 。 不 过 自 引 用 结构 体 这 东西 其 实 也 没有 什么 特别 之 处 。 


不 过 ， 在 声明 时 还 是 需要 稍 加 留意 。 


typedef struct Hoge tag { 
int a; 
int b; 


struct Hoge tag *next; 
} Hoge; 





在 上 面 这 种 情况 下 ， 在 声明 成 员 next 时 typedef 还 没有 完成 ， 
所 以 不 能 使 用 Hoge 类 型 ， 因 此 这 里 声明 为 了 struct Hoge tag *。 


或 者 也 可 以 写成 下 面 这 样 。 
typedef struct Hoge tag Hoge 


struct Hoge tag { 
int a; 
int b; 
Hoge *next; 


}; 





6-3-3 ”结构 体 的 相互 引用 
我 们 曾 在 3-2-10 节 中 提 到 ， 相 互 引 用 的 结构 体 可 以 像 下 面 这 样 先 


声明 标签 。 





typedef struct Woman_tag Woman; 《<-- 事先 typedef 标 签 
typedef struct { 


Woman *wife; /* 妻子 */ 
} Man; 


struct Woman tag { 


Man *husband; /* 丈夫 */ 





}; 


在 这 个 例子 中 ，Man 具有 指向 妻子 的 指针 ，Woman 具有 指向 丈夫 
的 指针 。 以 前 ， 对 于 这 段 说 明 ， 有 人 会 像 下 面 这 样 理解 。 


噢 噢 。 那 么 ， 如 果 把 标签 全 都 提前 typedef 好 ， 就 可 以 以 任意 


顺序 声明 结构 体 了 吧 ? 





于 是 就 有 了 按照 下 面 这 种 顺序 进行 声明 的 语句 。 


typedef struct Polyline tag Polylineje---- (本 行 及 以 下 1 行 ) 先 只 提前 声明 所 有 | 
typedef struct Shape tag Shape 





struct Shape tag { 
ShapeType type; 
union { 
Polyline ”polyline; <-- 只 声明 了 标签 使 用 了 Polyline 的 实体 


Rectangle rectangle; 
Ellipse ellipse 
} ui 
}; 


struct Polyline tag { 





}; 
但 是 这 段 代码 是 无 法 通过 编译 的 。 


在 只 声明 标签 的 情况 下 ， 该 类 型 就 是 一 个 不 完全 类 型 。 对 于 不 完全 
类 型 ， 我 们 只 能 获取 它 的 指针 〈3-2-10 市 ) 。 


这 是 因为 不 完全 类 型 的 长 度 还 未 确定 ， 采 用 上 面 这 种 写法 ， 编 译 器 
无 法 确定 结构 体 的 各 个 成 员 的 偏 移 量 。 


6-3-4 结构 体 的 藤 套 
在 将 一 个 结构 体 用 作 另 一 个 结构 体 的 成 员 时 ， 也 可 以 像 下 面 这 样 使 


用 已 经 声明 过 的 结构 体 。 


typedef struct { 
int a; 
int b; 

} Hoge; 


typedef struct { 





Ee hoge; 《<-- 将 结构 体 Hoge 用 作 Piyo 的 成 员 
} Piyo; 

还 可 以 在 一 个 结构 体 的 声明 中 声明 另 一 个 结构 体 类 型 ， 同 时 将 其 声 
明 为 成 员 。 





typedef struct { 


struct Hoge tag { 
int a; 
int b; 
} hoge; 
} Piyo; 





对 于 这 里 声明 的 struct Hoge_tag， 我 们 以 后 也 可 以 使 用 。 不 
过 ， 在 使 用 该 方法 时 ， 可 以 省 略 标 签 ， 所 以 也 可 以 写成 下 面 这 样 。 


typedef struct { 


struct { 


int a; 
int b; 
} hoge; 
} Piyo; 





在 这 种 情况 下 ， 之 后 是 不 可 以 重复 使 用 该 类 型 的 。 


我 一 般 不 会 在 结构 体 的 声明 中 声明 结构 体 ， 倒 是 常常 在 结构 体 中 声 
明 联 合体 。 关 于 联合 体 ， 请 看 下 一 市 。 


6-3-5 ”联合 体 
在 大 多 数 情况 下 ， 联 合体 需要 与 结构 体 、 枚 举 类 型 组 合 使 用 。 


在 第 5 章 中 ， 我 们 像 下 面 这 样 定义 了 Shape 类 型 。 


”下 面 的 例子 来 自 第 5 章 ， 不 过 这 里 对 它 进行 了 简化 。 


typedef enum { 
POLYLINE_SHAPE, 
RECTANGLE_SHAPE ， 
ELLIPSE_SHAPE 

} ShapeType 


typedef struct Shape tag { 
ShapeType type; 
union { 
Polyline polyline; 
Rectangle rectangle; 
Ellipse ellipse; 
} uy; 
} Shape; 





Shape 5 可 能 是 Polyline 《折线 ) ， 可 能 是 Rectangle 【长 方 
二 也 可 能 是 Ellipse (椭圆 )。 在 这 种 情 况 下 ， 我 们 可 以 使 用 联 


O 


枚 举 类 型 shapeType 用 于 表示 联合 体 中 当前 真正 在 使 用 的 成 员 是 
哪 一 种 图 形 (这 种 用 途 的 枚 举 类 型 成 员 被 称 为 标签 ) 。 程 序 员 有 责任 确 
保 枚 举 的 标识 (标签 ) 与 真正 保存 的 成 员 之 间 的 一 致 性 。 


某 些 书 中 经 音像 下 面 这 样 使 用 联合 体 。 


typedef union { 
char c[4]; 


int int value; 
} Int32; 





这 样 一 来 ， 在 int 为 4 字 节 的 情 ; 就 可 以 通过 c 以 字 节 为 
单位 对 保存 在 int_value 中 的 整 信 韶 行 洁 癌 。 


那么 ， 上 述 访问 会 导致 什么 样 的 结果 呢 ? 这 依赖 于 运行 环境 的 字 节 


序 (2-8 节 ) ， 而 且 标准 中 本 来 也 没有 规定 int 就 是 32 位 。 

我 并 不 想 不 分 青红皂白 地 去 否定 这 种 写法 ， 但 在 使 用 这 一 技巧 时 ， 
应 该 时 刻 铭记 一 点 : 这 样 写 出 来 的 代码 基本 上 没有 可 移植 性 。 
6-3-6 无 名 结构 体 和 无 名 联合 体 (C11) 

在 上 述 shape 结构 体 中 ， 我 们 给 用 于 表示 各 个 图 形 的 联合 体 成 员 


取 名 为 u。 假 设 有 指向 Shape 结构 体 的 指针 shape， 当 该 Shape 中 
保存 的 是 折线 时 ， 可 以 通过 以 下 方式 引用 折线 的 坐标 的 数量 。 


shape->u.polyline.npoints 


大 家 有 没有 觉得 这 个 u. 有 些 碍 事 儿 呢 ? 这 个 u. 是 为 了 在 结构 体 
中 包含 联合 体 而 起 的 名 字 ， 但 如 果 没 有 它 也 不 会 发 生 名 称 重 复 ， 不 写 反 
而 能 使 代码 更 加 简洁 。 

根据 C11 的 无 名 结构 体 (anonymous structure) 和 无 名 联合 体 
(anonymous union) 功能 ， 即 便 不 给 这 样 的 结构 体 或 联合 体 定义 名 
称 ， 也 可 以 使 用 。 


具体 写法 如 下 所 示 。 


typedef struct Shape tag { 
ShapeType type; 
union { 
Polyline polyline; 


Rectangle rectangle; 
Ellipse ellipse; 
}; 《<-- 没有 u 
} Shape; 





在 实际 引用 成 员 时 要 写成 下 面 这 样 。 





shape->polyline.npoints <-- 不 需要 u. 


不 过 ， 如 果 一 开始 定义 的 就 是 像 u 这 样 很 短 的 名 称 ， 那 么 即使 改 
成 无 名 ， 也 只 是 节省 了 u. 这 两 个 字符 。 因 此 ， 老 实说 我 觉得 这 个 功能 


6-3-7 ”数组 的 初始 化 
一 维 数组 可 以 以 如 下 形式 进行 初始 化 。 


int hoge[] = {1, 2, 3, 4, 5}; 


由 于 编译 器 会 为 我 们 计算 数组 的 元 素 个 数 ， 所 以 这 里 不 必 将 它 特地 
写 出 来 。 或 者 说 为 了 防止 不 必要 的 错误 ， 不 写 反倒 更 好 。 


二 维 以 上 的 数组 可 以 以 如 下 形式 进行 初始 化 。 


hoge[]j[3] = { 
{1, 2,3}, 


{4, 5, 6}, 
{7,，8, 9}, 





“最 外 层 ” 以 外 的 数组 的 元 素 个 数 是 不 能 省 略 的 。 具 体 请 参考 3- 
SY ig 


char 的 数组 可 以 特别 地 通过 以 下 形式 进行 初始 化 。 


”具体 来 说 ，wchar_t 的 数组 也 可 以 以 同样 的 方式 进行 初始 化 。 不 过 ， 此 时 请 对 字符 
串 字 面 量 加 上 L， 比 如 写成 L" 一 二 三 四 五 " 这 样 。 





char str[] = "abc"; 


它 是 下 面 的 代码 的 语法 糖 。 


char str[] = {'a', 'b', 'c', '\8'); 





由 于 结尾 处 加 入 了 空 字 符 ， 所 以 str 的 元 素 个 数 为 4。 
在 这 种 情况 下 ， 如 果 元 素 个 数 没 写 对 ， 就 很 容易 产生 如 下 错误 。 


”而 且 ， 如 果 只 是 缺少 空 字符 的 部 分 ， 是 不 会 引发 编译 错误 的 ! 


char str[3] = "abc"; <-- 把 '/e' 的 部 分 态 记 了 





为 了 避免 产生 这 样 的 错误 ， 应 该 在 定义 时 省 略 元 素 个 数 ， 让 编译 器 
去 计算 。 

个 过 ， 在 实际 的 程序 中 ， 需 要 使 用 字符 串 来 初始 化 char 的 数组 的 
情况 并 不 常见 ， 在 大 多 数 情况 下 ， 写 成 下 面 这 样 会 比较 合适 。 


char *str = "abc"; 


两 者 的 差别 在 于 ， 前 者 是 对 “char 的 数组 ”的 内 容 进行 初始 化 ， 
而 后 者 是 将 “指向 char 的 指针 ”指向 字符 串 字 面 量 。 由 于 字符 串 字 面 
i i i 
侍 串 的 内 容 。 


6-3-8 指向 char 的 指针 的 数组 的 初始 化 


,ow 在 获取 由 多 个 字符 囊 组 成 的 数组 时 ， 通 党 使 用 “指向 char 的 指针 
Es 组 ” 


char *color name[] = { 
"red", 


"green", 





最 后 的 “blue” 的 后 面 跟着 一 个 逗号 ， 不 过 这 并 不 是 笔 误 。 


在 。 语言 中 。 无 认 是 否 在 数组 的 初始 化 列表 的 最 后 一 个 元 素 之 后 


对 于 这 个 规则 ， 似 乎 有 人 不 以 为 然 ， 但 我 却 相当 中 意 。 因 为 这 样 一 
来 ， 束 可 以 很 方便 地 在 数组 的 后 面 添加 元 素 。 特 别 是 对 于 字符 串 ， 如 果 


没有 在 最 后 写 上 喜 号 ， 在 添加 元 素 时 就 容易 一 个 小 心 把 代码 写成 下 面 这 
样 。 


char *color name[] = { 
"red", 
"green", 


"blue" <-- 忘记 写 逗 号 
"yellow" 





由 于 ANS1 5C 之 后 的 5 语言 会 擅自 将 相 邻 的 字符 串 字 面 量 连接 起 
来 ， 所 以 这 里 就 会 变 成 由 red、green 和 blueyellow 组 成 的 元 素 个 
数 为 3 的 数组 ”。 


”很 明显 ， 这 个 问题 是 由 擅自 拼接 相 邻 的 字符 串 字面 量 这 一 令 人 困惑 的 设计 引发 的 。 
虽然 字符 串 拼接 的 功能 本 身 是 很 方便 的 ， 但 既然 要 设计 这 样 的 功能 ， 那 完全 可 以 设计 成 在 字 
人 
问题 了 。 





根据 ANS1 C Rationale， 之 所 以 在 标准 中 加 入 “无 论 是 否 在 数组 

的 初始 化 列表 的 最 后 一 个 元 素 之 后 加 逗号 ， 都 没有 关系 ”这 一 规则 ， 据 

和 仅 是 为 了 便于 添加 和 删除 ， 还 是 为 了 能 够 简单 地 编写 自动 生成 代码 
工具 。 


然而 ， 枚 举 的 声明 却 并 非 如 此 ， 我 认为 这 样 的 实现 是 不 完整 的 。 


typedef enum { 
RED, 


GREEN, 
BLUE， <-- 在 ANSI C 中 ， 这 里 不 可 以 加 逗号 
} Color; 





不 过 ， 在 修订 后 的 C99 中 ， 这 里 已 经 可 以 写 喜 号 了 。 
6-3-9 ”结构 体 的 初始 化 
假设 有 以 下 结构 体 。 


typedef struct { 
int a; 


int b; 
} Hoge; 


通过 下 面 这 样 的 写法 ， 可 以 对 结构 体 的 内 容 进行 初始 化 。 


Hoge hoge = {5, 108}; 


即便 是 在 结构 体 有 肉 套 ， 或 者 结构 体 的 成 员 包 含 数 组 的 情况 下 ， 





typedef struct { 
int a[16]; 


Hoge hoge; 
} Piyo; 





只 要 能 够 像 下 面 这 样 一 一 对 应 地 准确 编写 初始 化 列表 ， 也 能 够 完成 
对 结构 体 的 初始 化 。 


Piyo piyo = { 
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, 
{1, 2}, 

}; 


6-3-10 ”联合 体 的 初始 化 


联合 体 与 结构 体 不 同 ， 它 的 成 员 之 中 只 有 某 一 个 成 员 具 有 有 效 值 。 
在 编写 初始 化 列表 时 ， 需 要 考虑 好 它 对 应 的 是 哪个 成 员 。 


根据 ANS1 C 的 规定 ， 对 联合 体 的 初始 化 是 针对 联合 体 的 第 一 个 成 
员 进 行 的 。 老 实说 ， 我 觉得 这 真是 一 个 奇怪 的 规则 ……… 





typedef union { 
int int value; 
char *str; 

} Hoge; 








Hoge hoge = {5}; 《<-- 初始 化 列表 对 应 于 int_value 


这 个 奇怪 的 规则 在 C99 中 已 得 到 改善 。 关 于 这 一 点 ， 请 看 下 一 


Ts 
6-3-11 指定 初始 化 (C99) 

正如 6-3-9 节 中 所 说 ， 在 ANS1 C 中 ， 在 初始 化 结构 体 时 必须 从 
开头 的 成 员 开 始 按 顺序 指定 值 。 当 成 员 数 量 众 多 时 ， 代 码 难以 阅读 ， 另 
外 也 存在 只 需 初始 化 结构 体 的 一 部 分 成 员 即 可 的 情况 。 


从 0599 开始 ， 我 们 就 已 经 可 以 使 用 指定 初始 化 器 (designated 
initializer) 显 式 地 指定 想 要 初始 化 的 成 员 了 。 


使 用 指示 符 ” 就 可 以 对 指定 的 结构 体 或 联合 体 的 成 员 进 行 初始 化 ， 
也 可 以 指定 数组 下 标 ， 从 而 对 数组 元 素 进行 初始 化 。 


”关于 指示 符 ， 这 里 补充 说 明 一 下 : 对 于 结构 体 元 素来 说 ， 将 指定 初始 化 器 中 的 点 号 


和 成 员 名 称 的 组 合 称 为 指示 符 ; 对 于 数组 元 素来 说 ， 将 指定 初始 化 器 中 的 方 括号 中 的 数字 称 
为 指示 符 。 具 体 示 例 请 参见 代码 清单 6-4。 一 一 译 者 注 





为 了 帮助 大 家 理解 ， 这 里 我 们 看 一 下 实例 ， 示 例 程序 如 代码 清单 
6-4 所 示 。 


代码 清单 6-4 designated initializer.c 





1 #include <stdio.h> 


2 
3 typedef struct { 
4 int a; 

5 int b; 

6 int c; 

7 int array[16]; 
8 } Hoge; 

9 

0 


16 typedef union { 


int int value 
double double value; 


} Piyo; 


int main(void) 


{ 


// 对 指定 的 结构 体 成 员 进行 初始 化 

// 对 指定 的 数组 下 标 对 应 的 元 素 进行 初始 化 

// 排 在 其 后 的 数值 会 继续 被 分 配给 指定 下 标的 元 素 之 后 的 元 素 
Hoge hoge = {.b= 3，.C = 5, {[3] = 16, 11, 12}}; 























fprintf(stderr, "hoge.b..%d, hoge.c..%d\n", hoge.b, hoge.c); 
fprintf(stderr, "hoge.array[3..] %d, %d, %d\n", 
hoge.array[3], hoge.array[4], hoge.array[5]); 





// 对 指定 的 联合 体 成 员 进行 初始 化 
Piyo piyo = {.double value = 123.456}; 
fprintf(stderr, "piyo.double value..%f\n", piyo.double value); 


return 0©; 





6-3-12 ”复合 字面 量 (C99) 


要 将 内 容 已 经 确定 的 结构 体 传 递 给 函数 ， 在 ANS1 5 中 就 需要 用 到 


| 临时 变量 ， 但 从 099 开始 ， 我 们 可 以 将 结构 体 或 数组 写成 字面 量 ， 这 
被 称 为 复合 字面 量 (compound literal) 。 


关于 这 一 点 ， 同 样 是 结合 实例 理解 起 来 更 快 。 请 参考 下 面 的 代码 清 


单 0-5。 


代码 清单 6-5 compound literal.c 





1 #include <stdio.h> 


2 


3 typedef struct { 


4 
5 


double x; 
double y; 


6 } Point; 


7 
8 void draw line(Point start p, Point end_p) 


9 1 

16 fprintf(stderr, "draw line: (%f, %f)-(%f, %f)\n", 
11 start p.x, start p.y, end p.x, end p.y); 
12 } 

13 

14 void draw polyline(int npoints, Point *point) 

15 { 

16 for (int i = 6;j i < npoints; i++) { 

17 fprintf(stderr, "[i]..(%f, %f)\n", point[i].x, point[i].y); 
18 } 

19 } 

20 

21 int main(void) 

22 { 

23 draw_ line((Point){.x = 16，.y = 16}, (Point){.x = 20，.y = 2601})) 
24 

25 draw_polyline(5， 

26 (Point[]){ 

27 (Point){.x = 1，.y = 1}, 

28 (Point){.x = 2, .y = 2}, 

29 (Point){.x = 3, .y = 3}, 

36 (Point){.x = 4, .y = 4}, 

31 (Point){.x = 5, .y = 5}, 

32 }); 

33 } 





本 例 实现 了 在 不 使 用 | 
递 Point 结构 体 的 复合 字面 量 ， 向 范 数 draw_polyline() 传递 
Point 结构 体 的 数组 。 





乍 时 变量 的 情况 下 ， 向 范 数 draw_line() 传 
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